stMind

You'll never blog alone

Learning by Associationの論文を軽く読む

[1706.00909] Learning by Association - A versatile semi-supervised training method for neural networks (画像は論文より引用) CVPR2017で発表された論文の一つ。ミュンヘン工科大学とGoogleの共著。 図にあるように、ラベルあり(A)とラベルなし(B…

CNNによるテキスト分類で学習済みword2vec(fastText)を使う

CNNとテキスト分類で検索すると、一番最初に出てくるWildMLのチュートリアル。 チュートリアルではembedding layerも含めて学習するようになっていますが、embeddingのところはFacebookが公開しているfastTextの学習済みword2vecで置き換えてやってみました…

Try word2vec in 5 minutes

Task word2vecを使ったテキスト分類の問題(質問文?回答文?)をやってみます。 Steps datasetの入手 pre-trained modelの入手 datasetとpre-trained modelのロード 学習 評価 1. datasetの入手 まずはデータセットが必要ですが、UCSD(カリフォルニア大学…

アーセンベンゲル補完計画、始めました

先月末、ベンゲル監督が二年間の契約延長を発表しました。 www.arsenal.com 今シーズンは、就任以来初じゃないかと思うほどの不振が続いて、契約満了を迎える今シーズンで本当に辞めてしまうかもしれないと思いました。 とりあえず、契約更新は喜ばしいです…

MacとLinuxでディレクトリ内ファイルリストを取得する時の挙動が違う?

以前作ったDeep Learningを使ったブランドロゴ認識だけど、ありがたいことに使ってくれる方がいて、githubにissueが来ました。 github.com 27クラスのロゴ画像をそれぞれ学習用、テスト用に分けてpickle化するスクリプトでエラーになるということらしい。Iss…

研究を売れ

研究を売れ!―ソニーコンピュータサイエンス研究所のしたたかな技術経営作者: 夏目哲,所眞理雄出版社/メーカー: 丸善プラネット発売日: 2016/01/30メディア: 単行本この商品を含むブログ (1件) を見る ソニーコンピュータサイエンス研究所(CSL)の研究成果を…

Habits change into character

休暇中ということもあり、2017年がふわっとスタートしたわけですが、一年の計は元旦にありの教えに従って今年の抱負を記しておきたいと思います。(既に元旦ではなくなってますが、それはおいておきます) 「身につけた習慣が個性になる」 タイトルを意訳す…

Tensorflowでロゴ画像を分類する

UdacityのDeep LearningコースでTensorflowを試してみたものの、いまいちしっくりこない感じがありました。こういうのは、自分で何かしら作って試してみるのが一番ということで、ブランドロゴ画像の分類をしてみました。 なお、ここで書いたコードは GitHub …

matlabでは行列を行ベクトルにするとcolumn major order

3x3の行列Aを9x1の行ベクトルに直すと、1, 2, 3, 4, 5, 6, 7, 8, 9となると思っていたら、1, 4, 7, 2, 5, 8, 3, 6, 9だった... (column major order) >> A A = 1 2 3 4 5 6 7 8 9 >> A(:) ans = 1 4 7 2 5 8 3 6 9 >> ちなみに、numpyだと指定しない限り、ro…

アーセナルの攻撃スタイルにみるUnix哲学

バーディー、結局残留ですってね。 www.soccer-king.jp アーセナルに来たら、相手も引いて守るし、スペースがない中でバーディーは活躍できないんじゃないかなんて言われてましたが、 僕は十分フィットするなぁと思ってました。というよりも、バーディーのよ…

How AlphaGo WorksとAlphaGoの裏側

How AlphaGo Works from Shane (Seungwhan) Moon www.slideshare.net DeepMindがNatureに投稿した論文を、CMUのPhDの方が解説しているプレゼン資料がslideshareにありました。 AlphaGoの仕組みがとても分かりやすくまとめてあり、英語ですが一読の価値ありで…

誰も教えてくれない秘密の扉の喩え話

medium.com 真面目で努力家な人ほど、正攻法なんだけど一番成功するのが難しい方法をとってしまいがちなんだよなぁ。成功が難しいというか、競争率の激しい方法ですね。 大変に成功した人というのは、人生やビジネス、そして成功はナイトクラブのように捉え…

参考にならないかもしれない東京マラソン参加レポート

走ってきました、東京マラソン2016。 フィニッシュ時間は5時間20分。 ラスト10キロは両足がほぼつった状態で、なんとかゴールまでたどり着いた感じでしたが、 最後まで歩かずに走りきったので満足です。 来年も走りたいなぁと思いつつ、抽選に当選しないとい…

TensorFlowのRun a TensorFlow demo modelでつまずかない

UdacityでTensorFlowを使ったディープラーニングの講義が始まりましたね。 www.udacity.com 遅ればせながらTensorFlowをインストールすることにしました。pipでインストールは問題なかったですが、手書き文字認識のデモを実行してみると、タイムアウトになっ…

2016年にやりたいこと

気力と体力の充実 年齢を重ねるにつれて、心と体の充実があらゆる活動の基盤になっていることを痛感します。ランニングを習慣化したことで体調をコントロールできるようになったので、2016年も続けていきたい。運動不足で悩んでいる人には是非お勧めしたい。…

Stand on the words of giants

「世界」を変えろ! 急成長するスタートアップの秘訣作者: デビッド・S・キダー,小林啓倫出版社/メーカー: 日経BP社発売日: 2013/09/05メディア: 単行本この商品を含むブログを見る 色々なスタートアップの創業者達へのインタビュー本。日本でも馴染みのあるF…

git add --patchをy or nキーのみで決定する設定

stackoverflowは読んでるだけでも色々発見があります。 git add -pしたときにy or nキーのみで、Enterキーなしで決定できるようになる設定です。 $ git config --global interactive.singleKey true

「駐輪場」を検索する

クロスバイクを初めて手に入れて、時間があったら自転車に乗って出かけたいと思ってます。そこで困ること第一位は、駐輪場。じゃあってことで、Googleで「駐輪場」と検索してみると近くの駐輪場がいくつか出てきます。よしっと思って行ってみると満車… しょ…

kaggleのデータファイルをwgetで並列ダウンロード

kaggleのデータファイルをwgetで並列ダウンロードする方法を調べた。スクリプトを書いたりすることなく、コマンドラインで完結するのでお手軽。 1. pupでリンクアドレスを取得する chromeのデベロッパーツール等で確認、CSSセレクタを使ってアドレスを取り出…

「The Platform : IT企業はなぜ世界を変えるのか」を読んだ

ザ・プラットフォーム:IT企業はなぜ世界を変えるのか?作者: 尾原和啓出版社/メーカー: PLANETS発売日: 2015/06/09メディア: Kindle版この商品を含むブログを見る いつも思うことだけど、GoogleやApple、Facebook、Twitterがない世界を想像するのがもはや困…

numpy, scipy, sklearnを駆使してBag of Visual Words

bag of visual wordsは多くの場面で出てくるのでさくっと使えるようにしておきたい。numpyとscipyをsklearnを使えば、とても簡単に使えるので流れをまとめておくことにします。 #!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import sc…

CVPR2015の採択論文タイトルのWordCloud

CVPR 2015 Webpage CVPR2015のProgramがアナウンスされているみたいなので、論文のタイトルをスクレイピングしてWord Cloudを作ってみました。 論文のタイトルはpupを使って取得しました。Oralの発表者がPosterも発表するケースもあるようなので、sortとuniq…

Internetのインタフェース

融けるデザイン ―ハード×ソフト×ネット時代の新たな設計論作者: 渡邊恵太出版社/メーカー: ビー・エヌ・エヌ新社発売日: 2015/01/21メディア: 単行本(ソフトカバー)この商品を含むブログを見る これはGW前から読んでいた一冊。まだ読了していないけど、と…

大企業向けのリーンスタートアップ論

シリアル・イノベーター ─ 「非シリコンバレー型」イノベーションの流儀作者: アビーグリフィン,レイモンド L プライス,ブルース A ボジャック出版社/メーカー: プレジデント社発売日: 2014/04/05メディア: Kindle版この商品を含むブログを見る GWに一気読み…

プランクトン画像分類で1位になったチームの解説ブログのメモ(2)

Classifying plankton with deep neural networksbenanne.github.io プランクトン画像分類で1位を取ったチームの解説ブログを読み進めました。 今回は、ネットワークアーキテクチャの所。 Kaggleで1位を取るためには、これくらいの改良をする必要があるんで…

プランクトン画像分類で1位になったチームの解説ブログのメモ(1)

プランクトン画像分類でトップを取ったチームが、自分たちが採用した手法を解説したブログエントリーを 書いてくれています。 Classifying plankton with deep neural networksbenanne.github.io 今回のコンペはフォーラムを読む英語力と、そこで公開されて…

cxxnetでKaggleのプランクトン画像分類に取り組んだ話

Description - National Data Science Bowl | Kagglewww.kaggle.com 最終結果は286th / 1049でした。 今回、初めてKaggleのコンペティションに参加しましたが、やってみて思ったことを書き留めておきます。 Forumに投稿されているDeep LearningベースのStart…

Netflixの中の人が書いた「Ten lessons learned from building machine learning system」というブログエントリーのメモ

TechnoCalifornia: Ten Lessons Learned from Building (real-life impactful) Machine Learning Systems 少し前のエントリーですが、ざくっとポイントをメモしました。 Ten lessons More data and better models どちらかだけにフォーカスすると、うまくい…

MediumのBack channelが面白い

特にSteven Levyの記事が良いです。 Webで読めるニュース記事というよりは、キーパーソンのインタビューやニュースになった事象の裏側の話がまとめられた内容で、 なんとなく本に近い感じがしました。 今のところ、6つの記事が公開されてます。 GOOGLE: STIL…

2014年をブックマークから振り返る

2014年も残すはあと一日。 自身がブックマークした記事を通して、個人的に今年のニュースを振り返っておきたいと思います。 プライバシー問題 実証実験での無断撮影や別目的への無断流用のニュースが、今年始めに個人的に気になったニュースでした。顔認証や…

Pylearn2 and Theano on python3

TL;DR bleeding-edgeなTheanoであればpython3で実行可能 installation Bleeding-edge install instructions 書いてある通りのコマンドを実行すれば良い。numpyとscipyをアップグレードするときはno-depsオプションを外す。 $ pip install --upgrade --no-dep…

アーセナルらしさとDNA

ネスレカップ 国際女子サッカークラブ選手権2014 ネスレカップ 国際女子サッカークラブ選手権2014 後半からでしたが、アーセナルレディースの決勝戦を見てきました。 残念ながら0-2で負けてしまったんですが、随所に素晴らしいプレーがあって良い試合でした…

新宿御苑の紅葉 2014

もう終わりに近づいている感じではあったけど、見事な紅葉でした。 イチョウ 辺り一面が黄色で美しい。 楓 朱色、緑、黄色と組み合わせが美しい。 パノラマ 水面に写る紅葉が美しい。 他にも 吸い込まれそう。 動き出しそう。

つくばマラソン

初めてのフルマラソン、初完走。 感想はいくつかあるけれど、細かいことは書かずに写真だけ記録に残しておこう。 お疲れ様でしたー!

golangでHoG

TL;DR imageパッケージで低レベルに画素アクセスすることでHoGを計算出来る ただし、画素単位で画像を扱う処理を書くのは大変 OpenCVのgolang bindingsはあるが、まだまだ発展途上(HoGは含まれてない) go-opencv satojkovic/go-HoG-sample

golangでbinary tree

Code as Art: Binary tree and some generic tricks with golang golangでbinary treeを作る!というので読んでみると、理解しやすかったので、実装もトレースしてやってみた。 目標 「intやstringなど特定の型ではなく、任意の型を扱えるbinary treeを実装…

golangでjson.Marshalした時

構造体のフィールドにタグを指定した場合には、タグがJSONのキーとして使用される。 ただし、タグを指定するときに余分な空白を入れないようにする。 type Person struct { Name string `json:"N"` Addr string `json:"A"` } type Person2 struct { Name str…

golangのimageパッケージを使った時

はじめに golangで画像ファイルを開いて、画像サイズを取得するプログラムを書いていた。特に問題はなく実行できた。 package main import ( "fmt" "image" _ "image/jpeg" "log" "os" ) func main() { file, err := os.Open("flower.jpg") if err != nil { …

OSX MavericksでBashのShellshock対策をした

Apple曰く、OS Xのユーザのほとんどはbashの悪用に対して安全 - TechCrunch 確かに、自分もMacをサーバにして公開しているわけではないので、この脆弱性でリモートから攻撃される可能性は低いんですけどね。とはいえ危険が存在しているBashをそのまま使うの…

海外出張のために個人的に買ってよかったモノ2つ

何を今更なモノだけど記しておく。 ノイズキャンセリングイヤホン photo by illuminaut これは本当に買って良かったと思った。ヘッドフォンは圧迫感が強くて顔が痛くなるのでイヤフォンタイプを購入したのだけど、ノイズキャンセリングあるなしでこんなにも…

golangの機械学習ライブラリgolearnをインストール

Machine Learning in Go using GoLearn | Stephen Whitworth インストールはInstallation · sjwhitworth/golearn Wiki · GitHubに書いてある通りなんだけど、Issuesにも挙がってるエラーで追加の手順が必要だったのでメモ。 環境はOSX10.9.4とGo1.2.2。 1. I…

stackoverflowにあったopencvとpythonを使ったお手軽数字認識のサンプル

Simple Digit Recognition OCR in OpenCV-Python - Stack Overflow 上記リンクにある画像とコードをコピーすれば、手元で簡単に試せますYo! 前処理ステップ 数字が5行分並んだ画像を学習用の画像としてpitrain.pngという名前で保存します。その下にある学習…

Why Emacs?

Nyan Mode - Turn your Emacs into Nyanmacs!

Pythonで多層パーセプトロンの実装例

NNの構成 # initialize mlp = MLP(n_input_units=2, n_hidden_units=3, n_output_units=1) XORを実現する3層のニューラルネットワークを例として実装します。入力層は2、隠れ層は3、出力層は1つのニューロンを持ちます。 class MLP(object): """ 3 Layered P…

Steve Jobs: The Lost InteviewをiTunesでレンタルして見た

スティーブ・ジョブズ1995 ~失われたインタビュー~(字幕版)ポール・センDocumentary¥2000 1995年夏、PC誕生に関するドキュメンタリーTVの制作のために行われたスティーブジョブズのインタビュー。なぜLost interviewかというと、輸送中にインタビューを収録…

Deep Learning Business Models

Deep Learning Business Models Deep Learningに関する話題としては、アルゴリズム解説や実装例に関する記事を多く見かけますが、ビジネスモデルに関する考察は新しいなということで紹介。 Key issues まず始めにビジネスの観点から見たDeep Learningの主要…

誤差逆伝播法と最急降下法の数式を追いかける

誤差逆伝播法は「でんぱん」ではなくて「でんぱ」だとDeep Learning勉強会のUstで気づきました。 わかりやすいパターン認識作者: 石井健一郎,前田英作,上田修功,村瀬洋出版社/メーカー: オーム社発売日: 1998/08メディア: 単行本購入: 19人 クリック: 110回…

はてなブログでtexの下付き文字と上付き文字を書く場合に注意すること

markdownモードでtexを書く場合、条件によっては下付き文字と上付き文字が正しく解釈されなくなる様子。 自分が遭遇したtexとして解釈されなくなる条件は、下付き又は上付き文字を複数個記述して、かつ下付きもしくは上付きにしたい文字を中括弧で囲む場合。…

OneVsRestClassifierで多クラスの画像分類

pythonを使って簡単な画像分類を実現する - s.t.Mindで2クラスの画像分類を試しましたが、今回は多クラスの画像分類です。 多クラスの画像分類 多クラスになっても画像分類のステップ自体は2クラスの時と同じです。 学習画像を集める 画像を特徴量に変換する…

最近読んだ本とワイアード日本版の思い出

帰省のお供に読み物系の本を買って読んでみました。 ウェブとはすなわち現実世界の未来図である (PHP新書)作者: 小林弘人出版社/メーカー: PHP研究所発売日: 2014/04/02メディア: Kindle版この商品を含むブログを見る 第1章 ウェブ2.0以降の世界はこう変わっ…