【論文読み】MoViNets: Mobile Video Networks for Efficient Video Recognition 日本語まとめ
CVPR2021, Google ReserchのDan Kondratyukさんらの論文
忙しい人向け
どんな論文か
モバイルなどのデバイスでも利用しやすい効率的な動画分類モデルMoViNetsを提案。 ...
【論文読み】ViViT: A Video Vision Transformer 日本語まとめ
忙しい人向け
どんな論文か
Transformerだけを用いた動画分類モデルを提案。先行研究と比べてどこがすごい
Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...
【論文読み】Non-local Neural Networks
FAIRのTimeSformerを読んだので、関連研究のNon-local Neural Networksを確認する。
忙しい人向けどんな論文か
動画像間の長距離の依存性を捉えるためのnon-local 演算を提案。 ...
【論文読み】TimeSformer論文解説まとめ
論文 Is Space-Time Attention All You Need for Video Understanding?についてまとめた。忙しい人向けと論文全体の精読の2部構成。
忙しい人向け
FAIR ...