stMind

about Tech, Computer vision and Machine learning

2024-03-20から1日間の記事一覧

Scenic: A JAX Library for Computer Vision Research and Beyond

github.com Scenicは、TransformerベースのモデルにフォーカスしたオープンソースのJAXライブラリ。 最近、Transformerを適用した動画認識モデルの論文(ViViT, MTV, ObjectViViT)を読んでいる中で見かけていました。 研究のコードであっても、構造化され、…