動画処理 | でい tech blog

【論文読み】MoViNets: Mobile Video Networks for Efficient Video Recognition 日本語まとめ

2021年7月9日論文

CVPR2021, Google ReserchのDan Kondratyukさんらの論文

忙しい人向け

どんな論文か

モバイルなどのデバイスでも利用しやすい効率的な動画分類モデルMoViNetsを提案。 ...

2021年11月2日

忙しい人向け

どんな論文か

Transformerだけを用いた動画分類モデルを提案。

先行研究と比べてどこがすごい

Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...

2021年4月20日論文

2021年11月2日

FAIRのTimeSformerを読んだので、関連研究のNon-local Neural Networksを確認する。

忙しい人向け

どんな論文か

動画像間の長距離の依存性を捉えるためのnon-local 演算を提案。 ...

2021年4月15日論文

2021年11月2日

論文　Is Space-Time Attention All You Need for Video Understanding?についてまとめた。忙しい人向けと論文全体の精読の2部構成。

忙しい人向け

FAIR ...