ViViT | でい tech blog

【論文読み】ViViT: A Video Vision Transformer 日本語まとめ

2021年5月26日deeplearning,論文

No Image

2021年11月2日

忙しい人向け

どんな論文か

Transformerだけを用いた動画分類モデルを提案。

先行研究と比べてどこがすごい

Transformer baseの手法は、大規模な学習データセットが必要だが、学習中にモデルを効 ...