stMind

about Arsenal, Arsene Wenger, Tech, Computer vision and Machine learning

CNNによるテキスト分類で学習済みword2vec(fastText)を使う

CNNとテキスト分類で検索すると、一番最初に出てくるWildMLのチュートリアル。 チュートリアルではembedding layerも含めて学習するようになっていますが、embeddingのところはFacebookが公開しているfastTextの学習済みword2vecで置き換えてやってみました…

Try word2vec in 5 minutes

Task word2vecを使ったテキスト分類の問題(質問文?回答文?)をやってみます。 Steps datasetの入手 pre-trained modelの入手 datasetとpre-trained modelのロード 学習 評価 1. datasetの入手 まずはデータセットが必要ですが、UCSD(カリフォルニア大学…

アーセンベンゲル補完計画、始めました

先月末、ベンゲル監督が二年間の契約延長を発表しました。 www.arsenal.com 今シーズンは、就任以来初じゃないかと思うほどの不振が続いて、契約満了を迎える今シーズンで本当に辞めてしまうかもしれないと思いました。 とりあえず、契約更新は喜ばしいです…

MacとLinuxでディレクトリ内ファイルリストを取得する時の挙動が違う?

以前作ったDeep Learningを使ったブランドロゴ認識だけど、ありがたいことに使ってくれる方がいて、githubにissueが来ました。 github.com 27クラスのロゴ画像をそれぞれ学習用、テスト用に分けてpickle化するスクリプトでエラーになるということらしい。Iss…

研究を売れ

研究を売れ!―ソニーコンピュータサイエンス研究所のしたたかな技術経営作者: 夏目哲,所眞理雄出版社/メーカー: 丸善プラネット発売日: 2016/01/30メディア: 単行本この商品を含むブログ (1件) を見る ソニーコンピュータサイエンス研究所(CSL)の研究成果を…

Habits change into character

休暇中ということもあり、2017年がふわっとスタートしたわけですが、一年の計は元旦にありの教えに従って今年の抱負を記しておきたいと思います。(既に元旦ではなくなってますが、それはおいておきます) 「身につけた習慣が個性になる」 タイトルを意訳す…

Tensorflowでロゴ画像を分類する

UdacityのDeep LearningコースでTensorflowを試してみたものの、いまいちしっくりこない感じがありました。こういうのは、自分で何かしら作って試してみるのが一番ということで、ブランドロゴ画像の分類をしてみました。 なお、ここで書いたコードは GitHub …

matlabでは行列を行ベクトルにするとcolumn major order

3x3の行列Aを9x1の行ベクトルに直すと、1, 2, 3, 4, 5, 6, 7, 8, 9となると思っていたら、1, 4, 7, 2, 5, 8, 3, 6, 9だった... (column major order) >> A A = 1 2 3 4 5 6 7 8 9 >> A(:) ans = 1 4 7 2 5 8 3 6 9 >> ちなみに、numpyだと指定しない限り、ro…

アーセナルの攻撃スタイルにみるUnix哲学

バーディー、結局残留ですってね。 www.soccer-king.jp アーセナルに来たら、相手も引いて守るし、スペースがない中でバーディーは活躍できないんじゃないかなんて言われてましたが、 僕は十分フィットするなぁと思ってました。というよりも、バーディーのよ…

How AlphaGo WorksとAlphaGoの裏側

How AlphaGo Works from Shane (Seungwhan) Moon www.slideshare.net DeepMindがNatureに投稿した論文を、CMUのPhDの方が解説しているプレゼン資料がslideshareにありました。 AlphaGoの仕組みがとても分かりやすくまとめてあり、英語ですが一読の価値ありで…

誰も教えてくれない秘密の扉の喩え話

medium.com 真面目で努力家な人ほど、正攻法なんだけど一番成功するのが難しい方法をとってしまいがちなんだよなぁ。成功が難しいというか、競争率の激しい方法ですね。 大変に成功した人というのは、人生やビジネス、そして成功はナイトクラブのように捉え…

参考にならないかもしれない東京マラソン参加レポート

走ってきました、東京マラソン2016。 フィニッシュ時間は5時間20分。 ラスト10キロは両足がほぼつった状態で、なんとかゴールまでたどり着いた感じでしたが、 最後まで歩かずに走りきったので満足です。 来年も走りたいなぁと思いつつ、抽選に当選しないとい…

TensorFlowのRun a TensorFlow demo modelでつまずかない

UdacityでTensorFlowを使ったディープラーニングの講義が始まりましたね。 www.udacity.com 遅ればせながらTensorFlowをインストールすることにしました。pipでインストールは問題なかったですが、手書き文字認識のデモを実行してみると、タイムアウトになっ…

2016年にやりたいこと

気力と体力の充実 年齢を重ねるにつれて、心と体の充実があらゆる活動の基盤になっていることを痛感します。ランニングを習慣化したことで体調をコントロールできるようになったので、2016年も続けていきたい。運動不足で悩んでいる人には是非お勧めしたい。…

Stand on the words of giants

「世界」を変えろ! 急成長するスタートアップの秘訣作者: デビッド・S・キダー,小林啓倫出版社/メーカー: 日経BP社発売日: 2013/09/05メディア: 単行本この商品を含むブログを見る 色々なスタートアップの創業者達へのインタビュー本。日本でも馴染みのあるF…

git add --patchをy or nキーのみで決定する設定

stackoverflowは読んでるだけでも色々発見があります。 git add -pしたときにy or nキーのみで、Enterキーなしで決定できるようになる設定です。 $ git config --global interactive.singleKey true

「駐輪場」を検索する

クロスバイクを初めて手に入れて、時間があったら自転車に乗って出かけたいと思ってます。そこで困ること第一位は、駐輪場。じゃあってことで、Googleで「駐輪場」と検索してみると近くの駐輪場がいくつか出てきます。よしっと思って行ってみると満車… しょ…

kaggleのデータファイルをwgetで並列ダウンロード

kaggleのデータファイルをwgetで並列ダウンロードする方法を調べた。スクリプトを書いたりすることなく、コマンドラインで完結するのでお手軽。 1. pupでリンクアドレスを取得する chromeのデベロッパーツール等で確認、CSSセレクタを使ってアドレスを取り出…

「The Platform : IT企業はなぜ世界を変えるのか」を読んだ

ザ・プラットフォーム:IT企業はなぜ世界を変えるのか?作者: 尾原和啓出版社/メーカー: PLANETS発売日: 2015/06/09メディア: Kindle版この商品を含むブログを見る いつも思うことだけど、GoogleやApple、Facebook、Twitterがない世界を想像するのがもはや困…

numpy, scipy, sklearnを駆使してBag of Visual Words

bag of visual wordsは多くの場面で出てくるのでさくっと使えるようにしておきたい。numpyとscipyをsklearnを使えば、とても簡単に使えるので流れをまとめておくことにします。 #!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import sc…

CVPR2015の採択論文タイトルのWordCloud

CVPR 2015 Webpage CVPR2015のProgramがアナウンスされているみたいなので、論文のタイトルをスクレイピングしてWord Cloudを作ってみました。 論文のタイトルはpupを使って取得しました。Oralの発表者がPosterも発表するケースもあるようなので、sortとuniq…

Internetのインタフェース

融けるデザイン ―ハード×ソフト×ネット時代の新たな設計論作者: 渡邊恵太出版社/メーカー: ビー・エヌ・エヌ新社発売日: 2015/01/21メディア: 単行本(ソフトカバー)この商品を含むブログを見る これはGW前から読んでいた一冊。まだ読了していないけど、と…

大企業向けのリーンスタートアップ論

シリアル・イノベーター ─ 「非シリコンバレー型」イノベーションの流儀作者: アビーグリフィン,レイモンド L プライス,ブルース A ボジャック出版社/メーカー: プレジデント社発売日: 2014/04/05メディア: Kindle版この商品を含むブログを見る GWに一気読み…

プランクトン画像分類で1位になったチームの解説ブログのメモ(2)

Classifying plankton with deep neural networksbenanne.github.io プランクトン画像分類で1位を取ったチームの解説ブログを読み進めました。 今回は、ネットワークアーキテクチャの所。 Kaggleで1位を取るためには、これくらいの改良をする必要があるんで…

プランクトン画像分類で1位になったチームの解説ブログのメモ(1)

プランクトン画像分類でトップを取ったチームが、自分たちが採用した手法を解説したブログエントリーを 書いてくれています。 Classifying plankton with deep neural networksbenanne.github.io 今回のコンペはフォーラムを読む英語力と、そこで公開されて…

cxxnetでKaggleのプランクトン画像分類に取り組んだ話

Description - National Data Science Bowl | Kagglewww.kaggle.com 最終結果は286th / 1049でした。 今回、初めてKaggleのコンペティションに参加しましたが、やってみて思ったことを書き留めておきます。 Forumに投稿されているDeep LearningベースのStart…

Netflixの中の人が書いた「Ten lessons learned from building machine learning system」というブログエントリーのメモ

TechnoCalifornia: Ten Lessons Learned from Building (real-life impactful) Machine Learning Systems 少し前のエントリーですが、ざくっとポイントをメモしました。 Ten lessons More data and better models どちらかだけにフォーカスすると、うまくい…

MediumのBack channelが面白い

特にSteven Levyの記事が良いです。 Webで読めるニュース記事というよりは、キーパーソンのインタビューやニュースになった事象の裏側の話がまとめられた内容で、 なんとなく本に近い感じがしました。 今のところ、6つの記事が公開されてます。 GOOGLE: STIL…

2014年をブックマークから振り返る

2014年も残すはあと一日。 自身がブックマークした記事を通して、個人的に今年のニュースを振り返っておきたいと思います。 プライバシー問題 実証実験での無断撮影や別目的への無断流用のニュースが、今年始めに個人的に気になったニュースでした。顔認証や…

Pylearn2 and Theano on python3

TL;DR bleeding-edgeなTheanoであればpython3で実行可能 installation Bleeding-edge install instructions 書いてある通りのコマンドを実行すれば良い。numpyとscipyをアップグレードするときはno-depsオプションを外す。 $ pip install --upgrade --no-dep…