TechCrunch – Startup and Technology News
写真のカテゴリ自動分類をするImpalaというiPhoneアプリがTechcrunchで紹介されていました。
技術的にどんな感じのことをやっているのか気になったのでImpalaを作ったEUVISIONのHPに行ってみると、カテゴリ(Conceptと呼んでいる)を学習するアルゴリズムの説明ビデオがありました。
説明ビデオによると、
- 分類したいカテゴリに属する画像を集める
- 各画像を30個の色チャネルに分解
- ガボールフィルタ + 複数解像度のdense samplingで特徴抽出
- Bag of Visual Wordsでベクトル表現(Codebookアプローチと言っている)
- SVMを用いてカテゴリ検出器を学習, 学習はグリッドで実行
- 人間がインタラクティブに評価、モデルをチューニング
ということをやっているようです。
アルゴリズムの概要程度しかわかりませんが、非常にオーソドックスなアプローチという印象です。
手元にあった画像で試してみると全部で15カテゴリとなりましたが、全部でどれくらいのカテゴリが用意されているのかが気になるところです。