stMind

about Tech, Computer vision and Machine learning

Tensorflow Object Detection APIのCPU処理時間 on MacBook Pro

計測環境 MacBook Pro Late 2013モデル CPU: 2.8GHz Corei7 Mem: 8GB 1600MHz DDR3 デフォルトで指定されているssd_mobilenet_v1_coco_2017_11_17 計測はTensorflowのtimelineを使用。 def run_inference_for_single_image(image, graph): with graph.as_def…

Deep Learning for Videos

sites.google.com Deep Learningを動画に適用というのはこれから増えてくると思うし、問題を分類した上記ブログを借りて頭を整理しておくとよいなと思った。少し古いが参照論文リストもあるので、目を通すと良さそう。 Video Classification Image Classific…

MSCOCO keypoint challengeのWinner solution

blog.mapillary.com MSCOCO joint recognition challengeで、6つのタスクのうち4つでbest scoreだったのは、Megviiという顔認識技術の企業。人物の関節位置を推定するKeypoint challengeでは、Megviiは2017年でもTopだったようです。 CVPRにも採択されていた…

RegressionベースとHeatmapベースではどちらが良い?

モバイル向けのSingle person 2D ポーズ推定のレポジトリのIssueなのですが、興味深い内容だったので紹介します。 github.com CNNが前提だと思いますが、Keypoint localizationを行う方法として、 DeepPoseなど、関節位置を回帰するRegression OpenPoseなど…

MoveMirrorで使われているPose Estimation Algorithm

MoveMirror matches your movements with images from around the world. Built with TensorFlow.js and #PoseNet. Learn more here→ https://t.co/w6l4OPPu6G pic.twitter.com/gohe515f04— TensorFlow (@TensorFlow) 2018年7月19日 ポーズをとると似た姿勢…

VNect : 1枚のRGB画像からリアルタイムに3D pose estimation

www.youtube.com SIGGRAPH2017で発表された、単眼RGB画像から3D poseをリアルタイムに推定するVNectのプレゼン動画。音声が若干残念ですが、20分程度で概要を把握できましたので、さらっとまとめ。 3D poseとは Local 3D PoseとGlobal 3D Poseの二種類がある…

アーセンベンゲル監督のラストホームゲーム関連グッズ

ベンゲル監督の最後のエミレーツ、バーンリー戦で配られたグッズをebayで手に入れることができました。総額は、全部で2万円強。 送料が高かった(約3000円)のが痛かったけど、ベンゲル監督信者としては、これくらいなら十分出せますね! 今も、ebayではいく…

Deep Learning時代のPose Estimation研究

[1602.00134] Convolutional Pose Machines [1611.08050] Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 少し前まではPose estimationは非常に難しい問題だったように思いますが、Convolutional Pose MachinesやRealtime Multi-Pers…

KerasでGAN

towardsdatascience.com Mediumの記事を参考に、一番基本のGANについて試してみた。データセットはおなじみのfashion mnist。 GANのアーキテクチャ ノイズ画像(100次元のランダムなベクトル)からfashion画像を生成するgeneratorは、3層の全結合層から成る…

KerasでSemantic segmentation

画像ではなく、ピクセル単位でクラス分類するSegmentationのタスク。 fast.aiにあるtiramisuが実装もあって分かりやすいので試してみた。下記のコードスニペットは、fast.aiのオリジナル実装ではなく、keras2で書き直されたjupyter notebookのコードをベース…

WIndowsでTensorflow C++ APIを使う準備

TL;DR WindowsでTensorflowのC++ APIを使わなければいけないケースというのはそれほど多くないと思うし、どうしてもという理由がなければやらない方が良いと思う! ステップ 基本は、下記のブログを参照すれば出来る。 tadaoyamaoka.hatenablog.com cmakeを…

あなたは世界を変えない

Ruby on Railsの作者DHHさんのmediumエントリー。最近読んだ中でも一番良いなと思った。 TwitterやFacebookも世界を変えよう❗という明確なミッションを持って始まったわけではないし、そういうミッションを持つことは大変な重荷。壮大な幻想(ミッション)を…

CourseraのDeep Learning Specializationコースのまとめノートを見つけた

先日全てのレクチャーをやり終えたCourseraのDeep Learning Specializationコース。そのまとめノートをSlideShareで公開している人がいた❗ My notes from @AndrewYNg excellent deep learning specialization on Coursera (https://t.co/SdzM1S9gA2)Yay! fin…

PASCAL-Part Datasetのmatファイルフォーマットがようやくわかった

FCNでSemantic segmentationをやってみようと思いたち、物体のパーツ単位で正解マスクが提供されているPASCAL-Part Datasetを使うことにした。のだが、正解マスクが含まれているmatファイルのフォーマットがよくわからない!データセットにはオリジナル画像 …

大学との共同研究の話

今年度もあと1ヶ月あまり。会社員にとって区切りでもあるけど、それ以外の例えば学生にとっても、卒業という大きな節目がやってくる時期。自分は会社員でありながら、特に大学生の卒業はとっても身近な話でもあるんですよね。というのも、大学と共同研究をや…

CourseraのDeep Learning Specialization完走❗

11月から始めてSequence modelsのコース終了が2月なので、約3ヶ月でCourseraのDeep Learning Specialization(全5コース)を完了❗Gradesも100%で終えることが出来て良かった ちなみに、1ヶ月で5526円の課金が行われるので、自分の場合は受講料金は総額16578…

Arsenalのデータサイエンティスト職

アーセナルのデータサイエンティスト職の応募があった。すごい❗ ベンゲル監督にも分析結果を進言出来たりするのかな。夢のような職種だ... 実際の仕事内容を見てみる! 働く場所はロンドンのコルニー(トレーニング場) Trackingデータ、GPSデータ、その他の…

New year's resolution 2018

左腕と左足を、利き腕と利き足と同等にコントロール出来るようにする。 理由はない。 イメージはサンティ・カソルラ。

CourseraのDeep Learning SpecializationのCourse2まとめ

www.coursera.org 引き続き、Deep Learning SpecializationのCourse2を受講しました。Course1では日本語訳がありましたが、Course2では英語字幕(時々誤り有り)のみで、仕事で頭を使ってから帰った後で取り組むのは難しいものがありました。結局、週末に一…

CourseraのDeep Learning SpecializationのCourse1まとめ

www.coursera.org Andrew Ng先生のディープラーニング講座を始めました。Course1はNeural Network and Deep Learningで、Logistic regressionから始まって、Neural Networkの基本、Shallow and Deep Neural Networkという流れで学習するコースになってます。…

kinect生産終了のニュースに触れて

www.nikkei.com www.fastcodesign.com トータルで全世界3500万台、発売60日間で800万台売れたということでギネス記録にもなったキネクトが生産終了となるようです。 キネクトといえば、RGB-D画像からRandom Forestで部位を推定する手法がCVPR2010でベストペ…

インストール済みのcudnnのバージョン確認

#include <cudnn.h> #include <iostream> int main(int argc, char** argv) { std::cout << "CUDNN_VERSION: " << CUDNN_VERSION << std::endl; return 0; } $ nvcc cudnn_version.cpp -o cudnn_version $ ./cudnn_version CUDNN_VERSION: 5110 このプログラムはこのIssueで知っ</iostream></cudnn.h>…

flickr8k dataset

Deep Visual-Semantic Alignments for Generating Image Descriptions image caption用のflickr8k datasetは、アノテーションとVGGの特徴量は上記リンクからダウンロード可能ですが、対応する画像自体は別途ダウンロードする必要があります。各画像のダウン…

上手に考えるための引き出しを増やす

新しい分かり方作者: 佐藤雅彦出版社/メーカー: 中央公論新社発売日: 2017/09/20メディア: 単行本この商品を含むブログ (2件) を見る 新しいアイデアを必要とする状況というのは意外と多く、その度に同じような事しか考えられず、自分はアイデアを考える才能…

コンパイルエラーで個人的にわりとよく使うコマンド

OSX El Capitan 10.11.6です。 locate, export 例えば、とあるmakeを実行したらwchar.hが見つからないと言われました。 $ make g++ libRegionBPP/libRegionBPP.cpp -c -std=c++98 -pedantic -W -Wall -fopenmp -O3 -fPIC In file included from /usr/local/C…

openposeのjsonを解析する

昨日は、ナチョがウェストブロム戦で見せた奇跡のクリアをopenposeで関節推定してみました。openposeは、関節位置をファイル出力するオプションを用意しているので、jsonで出力して黒背景に関節位置を描画しましたが、その時の解析手順を簡単にまとめておき…

決定的瞬間のPose Estimation by OpenPose

これが誰か分かったあなたは立派なグーナーです。 答えはこちら。 'I was in the right place at the right time' | Interview | News | Arsenal.com

NLP for arsenal.com is difficult

スポナビライブの画面を開いたら、バギーズ戦の配信開始まで「1日と...」って明日かよー。 www.arsenal.com 最近というか、今年に入ってarsenal.comが変わった。試合毎に記事がまとまって見れるようになって、例えば上の vs Chelseaの記事は11本分がスクロー…

Learning by Associationの論文を軽く読む

[1706.00909] Learning by Association - A versatile semi-supervised training method for neural networks (画像は論文より引用) CVPR2017で発表された論文の一つ。ミュンヘン工科大学とGoogleの共著。 図にあるように、ラベルあり(A)とラベルなし(B…

CNNによるテキスト分類で学習済みword2vec(fastText)を使う

CNNとテキスト分類で検索すると、一番最初に出てくる[WildMLのチュートリアル]。 チュートリアルではembedding layerも含めて学習するようになっていますが、embeddingのところはFacebookが公開しているfastTextの学習済みword2vecで置き換えてやってみまし…