【論文読み】ViViT: A Video Vision Transformer 日本語まとめ
忙しい人向け
どんな論文か
Transformerだけを用いた動画分類モデルを提案。先行研究と比べてどこがすごい
Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...
情報系学生が深層学習に関連する論文や実装についてまとめるブログです。(動画処理系の論文が多め)
どんな論文か
Transformerだけを用いた動画分類モデルを提案。先行研究と比べてどこがすごい
Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...