stMind

about Tech, Computer vision and Machine learning

2024-05-05から1日間の記事一覧

CLIPのゼロショット分類におけるプロンプトアンサンブル

CLIPは、画像とテキストがデータセット内でペアになっているかどうかを予測するように事前学習されています。図の(2)と(3)にあるように、ゼロショット分類では、データセット内のすべてのクラス名を含んだテキストを作成し、CLIPによって最も確率の高い…