【論文読み】ViViT: A Video Vision Transformer 日本語まとめ
忙しい人向け
どんな論文か
Transformerだけを用いた動画分類モデルを提案。先行研究と比べてどこがすごい
Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...
エンジニアの学習記録
どんな論文か
Transformerだけを用いた動画分類モデルを提案。先行研究と比べてどこがすごい
Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...