stMind

about Arsenal, Arsene Wenger, Tech, Computer vision and Machine learning

iPTAMのreport.pdf

iPTAMの概要把握としてreport.pdfを読む。内容は主にポーティングの話で、まとめると

  • iPhoneコンパチブルなソースがiPTAM, iCVD, iTooN.
    • オリジナルはPTAM, LibCVD, TooN
  • オリジナルのPTAMからOpenGLやgvarsを削除.
    • 必要な変数はハードコード
  • LibCVDはすべてのファイルを調べ、必要な機能とファイルだけ残し、外部ライブラリへの依存関係を取り除いた.
  • アップルのvideo APIを使ってフレームを取得、OpenGL ESで動くようにグリッド描画機能を書きなおした.

これで、以下のような(といってもreport.pdfに書かれてたURLの動画は非公開なんだけど...)結果を得ることが出来たらしい。
(しょうがないのでiPTAMで検索して出てきた動画を代わりに)

ただし、現在は

  • マップの初期化後、追跡中の特徴点に一致する特徴点を検出できず、すぐにリカバリモードに入ってしまう

という問題があるようで、今はリカバリモードは無効にし、PTAMのトラッキングを続けるようにしているということです。

少し全体像が見通せたし、次は実際にコードを読んで動かせるように頑張ってみるか。