stMind

about Tech, Computer vision and Machine learning

mpld3の新しいサンプル

mpld3で新しいサンプルが紹介されていたので、mainとくっつけて動かしてみた。 点をマウスオーバーするとグラフが変化するようになっている。 from mpld3.plugins import PluginBase import jinja2 import json from mpld3 import show_d3 import matplotlib…

Sochi APIを使って国別メダル獲得数を図にする

Sochi API(非公式)があるんですね。 国別のメダル獲得数をJSONで取れるということで、最近発見したmpld3を使って図にしてみた。 (ヒストグラムにしたかったけど、mpld3のtooltipの使い方が上手くいかなかったので点をプロットしたのみ...)

「首折り男のための協奏曲」を読み終えた

首折り男のための協奏曲作者: 伊坂幸太郎出版社/メーカー: 新潮社発売日: 2014/01/31メディア: 単行本この商品を含むブログ (2件) を見る 短編集で区切り良く読み進める事ができたので、1週間くらいで読み終えた。 今は忙しくてこっちを向いてないかもしれな…

pythonの画像処理ライブラリscikit-image

scikit-image: Image processing in Python — scikit-image pythonで画像処理をするライブラリscikit-imageをインストールしてみた。 インストールは $ pip install -U scikit-image もしくは $ easy_install -U scikit-image -Uはアップグレードオプション…

「5 Mistakes Programmers Make when Starting in Machine Learning」が良い

5 Mistakes Programmers Make when Starting in Machine Learning | Machine Learning Mastery良い記事というのは、過不足なくシンプルであることが多いものです。 「機械学習を始めるときにプログラマーがやってしまう5つの間違い」がそのような感じでした…

「写真から属するサブカルチャーを認識するアルゴリズム」の論文

写真から「属するサブカルチャー」を識別できるアルゴリズム « WIRED.jp 少し前になりますが、Wiredで興味深い記事がありました。BMVC2013(British Machine Vision Conference)で発表されたようで、論文へのリンクがあったので内容を読んでみました。論文…

37signalsの「強いチームはオフィスを捨てる」を読んだ

強いチームはオフィスを捨てる: 37シグナルズが考える「働き方革命」作者: ジェイソン・フリード,デイヴィッド・ハイネマイヤー・ハンソン,高橋璃子出版社/メーカー: 早川書房発売日: 2014/01/24メディア: 単行本この商品を含むブログを見る 本当に集中して…

CourseraのMachine Learningコースの受講メモを取るときに使ったTexまとめ

本日、CourseraからMachine LearningコースのCertificateが届きました! コースのオンラインビデオを見ながらEvernoteにメモを取っていたのですが、数式を書くときにはLaTexiTを使って数式を画像にしてEvernoteに貼り付けていました。 新しい講義ビデオを見…

pythonのtqdmが良い感じ

ループのプログレスを表示してくれるtqdmを紹介。 showtermのテストも兼ねて。

pythonを使って簡単な画像分類を実現する

yhatでpythonを使って簡単な画像分類をするエントリがあったので紹介します。 画像分類のステップ 画像分類を実現するステップは以下の通りです。 学習画像を集める 画像を特徴量に変換する 識別器を学習, モデルを評価する 1. 学習画像を集める 分類器を学…

アップル対グーグルを読んだ

アップルvs.グーグル: どちらが世界を支配するのか作者: フレッドボーゲルスタイン,Fred Vogelstein,依田卓巳出版社/メーカー: 新潮社発売日: 2013/12/18メディア: 単行本この商品を含むブログ (1件) を見る アップルとグーグルが何を争い、どのように競争関…

英会話レッスンのサマリ

約半年で合計26時間ほど レッスンで使ったテキストは80ページ+ホームワークで15ページ Chapter1からChapter10 各Chapterで2から3個のTopics 2から4個のGrammer レッスンで使ったヒアリングのTrackは39+ホームワークで34 各Trackは大体30秒くらい(長くて1分…

Git Internals

GitHub トレーニングチームから学ぶ Git の内部構造 - connpassに行ってきました。 GitとSVNは何が違うのか?みたいなことを聞かれた時、今までであれば集中型と分散型の違いということで簡単に説明していましたが、今後は内部構造の違いから詳しく説明出来…

Impalaの学習アルゴリズム

TechCrunch – Startup and Technology News 写真のカテゴリ自動分類をするImpalaというiPhoneアプリがTechcrunchで紹介されていました。 技術的にどんな感じのことをやっているのか気になったのでImpalaを作ったEUVISIONのHPに行ってみると、カテゴリ(Conce…

PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類

cc licensed ( BY ) flickr photo shared by Loco Steve 週末に試そうのコーナー。 ちょうど良いチュートリアルがあったので、データセットを用意してやってみました。 問題 How can I get a computer to tell me what an article is about (provided method…

"Random Forest in Python"の紹介

Random Forestが短くまとめられたサイトを、備忘録を兼ねて紹介。 Random Forests in Python What is a Random Forest? アンサンブル学習に属する手法 アンサンブル学習 複数のモデルの組み合わせで一つの予測問題を解く 独立に学習と予測を行う識別器/モデ…

40000人の学生がSubmitしたコードの可視化

CourseraのMachine Learningコースで、ある課題に対してSubmitされた4万人分のコードを可視化したというブログ エントリーを紹介。 上のグラフではノードは各Submissionで、エッジが構文的に類似したノード間に引かれています。色はユニットテストに対する …

Twitterとは何か

(social network | microblogging | short messages) serviceである。 The complete history of Twitter as told through tortured descriptions of it in the New York Times – Quartz 2006年から2013年まで、New York Times上でTwitterが紹介された時のフ…

英会話は結局のところ人間力ではないかと思った話

自分が通っている英会話のレッスンでは、こんな感じの質問に答えていきます。 最近買ったものは何ですか?どこで買いましたか? これまでに旅行した国はどこですか? 最近の出来事で、腹が立ったことはなんですか?なぜですか? あなたにとっての記念日はい…

FacebookがKaggle上で開催しているコンテスト

https://www.kaggle.com/c/facebook-recruiting-iii-keyword-extraction Facebookがデータサイエンティストをリクルートするために開催しているコンテストの概要について読んでみました。 This competition tests your text skills on a large dataset from …

gitのトピックブランチをsvnのブランチにコミットする

gitでトピックブランチを作って作業していたものをsvnにブランチとしてコミットする方法。 $ git svn branch SomeFeature $ git branch -a master feature/SomeFeature remotes/SomeFeature $ git checkout feature/SomeFeature $ git rebase SomeFeature $ …

音楽の作り方

最近またLOVE PSYCHEDELICOをよく聴いてたので、なんとなく動画でもみてみるかってことで YouTubeで検索して見つけた今から約3年前くらいのラジオ番組の動画。 どのように音を録り、歌を加えて、楽曲に仕上げるのかの話で、要約すれば 「音楽の作り方(LOVE …

pythonでWord Cloud

scikit-learnの作者が作ったpythonのWord Cloudモジュールを使ってみたメモ。 README.mdにしたがって設定すれば特に難しいことはないと思われます。 必要なものを事前に入れておく $ pip install PIL $ pip install numpy $ pip install Cython $ pip instal…

MarkedでGithub Flavored Markdownを使う

Markdownのプレビューのために、vim-quickrunとMarkedでmarkdown編集が快適になった - Glide Note - グライドノートで 紹介されてたMarkedを買って使っています。 Github Flavored MarkdownのFenced code blockやSyntax highlighting(ソースコードに色付け…

はたらきたい展を見てきたよ

渋谷のパルコミュージアムで開催されているはたらきたい展に行ってきた。 HP見てもらうと詳しい展示内容がわかりますが、展示はその1からその6まであって、 スペースはそんなに広いわけではないですが、じっくり見ていると2,3時間はすぐにたっちゃう位に中身…

クレジットカード情報流出を聞いてカード再発行の手続きをしたのでまとめた

ここ数日話題になっているクレジットカード情報流出の件。 メールがGmailに届いていて、見事に対象期間に当てはまっていたので、再発行の手続きをしてきた。 gistに再発行するためにやったことをまとめておいた。 (なぜgist? なんとなくmarkdownで書きたかっ…

TopCoderのSRMに参加するときに困ったこと

TopCoderのSRMに初めて参加した。 問題を解くよりも、そもそもSRMのページに辿り着けなかったり、 Javaはインストールしているのに、Javaがインストールされてませんって出たりして、 準備する方がとても難しかった。 そこで、初参加するときに困ったことと…

Lean Analyticsのまとめ(1)

Lean Analytics: Use Data to Build a Better Startup Faster作者: Alistair Croll,Benjamin Yoskovitz出版社/メーカー: O'Reilly Media発売日: 2013/03/08メディア: Kindle版この商品を含むブログを見るLean Analyticsを読んでいます。すべて読んでからまと…

Build you own summaryのまとめ

文章要約アルゴリズムについて、興味深いブログ記事があって読んでみたのでまとめてみる。Build your own summary tool! | The Tokenizerアルゴリズムのquick overviewとhands on exercise, python implementationについての内容。コードはgistで公開されて…

2013年GWに読みたい本

既に読み始めているのもあるけれど、GW中に読みたい本を5冊挙げてみる。 Lean Analytics リーンスタートアップの拡張版的位置づけの本。 リーンスタートアップのコアコンセプトの一つ、Build - Measure - Learnのサイクルのうち、 Measurenステージにフォー…