stMind

You'll never blog alone

Github APIでWorking with two factor authentication

Githubで二段階認証を設定している場合に、ベーシック認証はAuthentication Codeの入力が必要になります。 rubyで書かれたdefunkt/gist · GitHubを参考に、アクセストークンを取得するサンプルを書いて試してみました。 Other Authentication Methods | GitH…

Deep Learningを学ぶ -その2-

CVPR2012のチュートリアルを読んで、適宜自分なりに補足しながらディープラーニングを学ぶの続き。 前回は導入までだったので、今回は多層のNNで学習を上手く行うための仕組みについて概観してみる。 (あくまでも概観で「だから」上手く行くというところま…

Deep Learningを学ぼう

Deep Learning Methods for Vision -CVPR2012 Tutorial- CVPR2012のチュートリアルの資料を、自分なりに補完しながらまとめていきたいと思います。ただし、繋がりが理解し難い所は適宜端折りながら進めていきます。 Introduction これまでの認識プロセス 入…

DeepPose, DeepFace and What's Next?

CVPR 2014 papers on the web - Papers CVPR2014の採択論文にDeepPoseとDeepFaceというタイトルがありました。 DeepPoseは姿勢推定、DeepFaceは顔認識の論文で、タイトルからも分かるようにDeep Learningを用いた手法です。 著者はGoogleとFacebookで、同じ…

OpenCVで画像を読み込んでOpenGLで描画する

OpenGLで画像上に3Dモデルを重畳したくて、久しぶりにOpenGLを触った。 OpenGLでは画像読み込みのAPIがない?ため、別のライブラリが必要になるみたい。そこで使い慣れたOpenCVを使って、画像を読み込んでGLで表示させてみた。 OpenCVのimreadを使うと、カラ…

Early detection of twitter trendsを読んでみた

Early detection of Twitter trends explained | computational amusement Twitterのストリームからトレンドを検出する取り組みはいくつかあると思うのですが、ノンパラメトリックなアプローチという点が、 よくあるアルゴリズムとは異なっていて興味深かっ…

matplotlibのhistとbar

ヒストグラムだからといってhistを使うと思い通りの結果にならないこともあって、barを使って意図した通りになったという話。 [(2058, 3), (2059, 2), (2100, 3), (2101, 1), (2102, 1)] 時刻毎のヒストグラムを作ろうと思ってhistを使ったら、時間が変わる…

pythonでインタラクティブなデータ可視化を実現するmpld3の紹介

例えば、pythonで機械学習のプログラムを書いて結果を可視化するといった場合、matplotlibを使うことが多いと思いますが、matplotlibで書いた図をインタラクティブに操作出来るようにするmpld3というライブラリがあるので、それを紹介します。 mpld3とは mpl…

Poseletの論文まとめ

画像中のグループが属するサブカルチャーを認識するアルゴリズムの論文で、人物検出手法として引用されていた論文を読んだので、簡単にまとめておきます。 タイトルは、「Poselets: Body Part Detectors Trained Using 3D Human Pose Annotations」です。 Po…

mpld3の新しいサンプル

mpld3で新しいサンプルが紹介されていたので、mainとくっつけて動かしてみた。 点をマウスオーバーするとグラフが変化するようになっている。 from mpld3.plugins import PluginBase import jinja2 import json from mpld3 import show_d3 import matplotlib…

Sochi APIを使って国別メダル獲得数を図にする

非公式ソチAPI『Sochi API Explorer』 | IDEA*IDEA Sochi API(非公式)があるんですね。 国別のメダル獲得数をJSONで取れるということで、最近発見したmpld3を使って図にしてみた。 (ヒストグラムにしたかったけど、mpld3のtooltipの使い方が上手くいかな…

「首折り男のための協奏曲」を読み終えた

首折り男のための協奏曲作者: 伊坂幸太郎出版社/メーカー: 新潮社発売日: 2014/01/31メディア: 単行本この商品を含むブログ (2件) を見る 短編集で区切り良く読み進める事ができたので、1週間くらいで読み終えた。 今は忙しくてこっちを向いてないかもしれな…

pythonの画像処理ライブラリscikit-image

scikit-image: Image processing in Python — scikit-image pythonで画像処理をするライブラリscikit-imageをインストールしてみた。 インストールは $ pip install -U scikit-image もしくは $ easy_install -U scikit-image -Uはアップグレードオプション…

「5 Mistakes Programmers Make when Starting in Machine Learning」が良い

5 Mistakes Programmers Make when Starting in Machine Learning | Machine Learning Mastery良い記事というのは、過不足なくシンプルであることが多いものです。 「機械学習を始めるときにプログラマーがやってしまう5つの間違い」がそのような感じでした…

「写真から属するサブカルチャーを認識するアルゴリズム」の論文

写真から「属するサブカルチャー」を識別できるアルゴリズム « WIRED.jp 少し前になりますが、Wiredで興味深い記事がありました。BMVC2013(British Machine Vision Conference)で発表されたようで、論文へのリンクがあったので内容を読んでみました。論文…

37signalsの「強いチームはオフィスを捨てる」を読んだ

強いチームはオフィスを捨てる: 37シグナルズが考える「働き方革命」作者: ジェイソン・フリード,デイヴィッド・ハイネマイヤー・ハンソン,高橋璃子出版社/メーカー: 早川書房発売日: 2014/01/24メディア: 単行本この商品を含むブログを見る 本当に集中して…

CourseraのMachine Learningコースの受講メモを取るときに使ったTexまとめ

本日、CourseraからMachine LearningコースのCertificateが届きました! コースのオンラインビデオを見ながらEvernoteにメモを取っていたのですが、数式を書くときにはLaTexiTを使って数式を画像にしてEvernoteに貼り付けていました。 新しい講義ビデオを見…

pythonのtqdmが良い感じ

ループのプログレスを表示してくれるtqdmを紹介。 showtermのテストも兼ねて。

pythonを使って簡単な画像分類を実現する

ŷhat | Content-based image classification in Python yhatでpythonを使って簡単な画像分類をするエントリがあったので紹介します。 画像分類のステップ 画像分類を実現するステップは以下の通りです。 学習画像を集める 画像を特徴量に変換する 識別器を学…

アップル対グーグルを読んだ

アップルvs.グーグル: どちらが世界を支配するのか作者: フレッドボーゲルスタイン,Fred Vogelstein,依田卓巳出版社/メーカー: 新潮社発売日: 2013/12/18メディア: 単行本この商品を含むブログ (1件) を見る アップルとグーグルが何を争い、どのように競争関…

英会話レッスンのサマリ

約半年で合計26時間ほど レッスンで使ったテキストは80ページ+ホームワークで15ページ Chapter1からChapter10 各Chapterで2から3個のTopics 2から4個のGrammer レッスンで使ったヒアリングのTrackは39+ホームワークで34 各Trackは大体30秒くらい(長くて1分…

Git Internals

GitHub トレーニングチームから学ぶ Git の内部構造 - connpassに行ってきました。 GitとSVNは何が違うのか?みたいなことを聞かれた時、今までであれば集中型と分散型の違いということで簡単に説明していましたが、今後は内部構造の違いから詳しく説明出来…

Impalaの学習アルゴリズム

Training Impala to detect a new concept from Euvision Technologies on Vimeo. 写真を自動的にカテゴリー分類してくれるImpala, 無料iPhoneアプリとしてローンチ | TechCrunch Japan 写真のカテゴリ自動分類をするImpalaというiPhoneアプリがTechcrunchで…

PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類

cc licensed ( BY ) flickr photo shared by Loco Steve 週末に試そうのコーナー。 ちょうど良いチュートリアルがあったので、データセットを用意してやってみました。 Teaching a Computer to Read: » The Scripted Blog 問題 How can I get a computer to …

Twitterのプログラミング面接を受けた人のブログ記事紹介

I Failed a Twitter Interview こういうInterviewの内容ってNDAになってるんじゃないのかなと思ったりするんだけど大丈夫なのかな。 Hacker NewsにTwitterのプログラミング面接を受けた人のブログエントリーがあって、具体的にどのような問題だったかが載せ…

"Random Forest in Python"の紹介

cc licensed ( BY NC ND ) flickr photo shared by clarkmaxwell Random Forests in Python Random Forestが短くまとめられたサイトを、備忘録を兼ねて紹介。 Random Forests in Python What is a Random Forest? アンサンブル学習に属する手法 アンサンブ…

40000人の学生がSubmitしたコードの可視化

Code Webs - Visualizing 40,000 student code submissions via kwout CourseraのMachine Learningコースで、ある課題に対してSubmitされた4万人分のコードを可視化したというブログ エントリーを紹介。 上のグラフではノードは各Submissionで、エッジが構文…

Twitterとは何か

(social network | microblogging | short messages) serviceである。 The complete history of Twitter as told through tortured descriptions of it in the New York Times – Quartz 2006年から2013年まで、New York Times上でTwitterが紹介された時のフ…

英会話は結局のところ人間力ではないかと思った話

自分が通っている英会話のレッスンでは、こんな感じの質問に答えていきます。 最近買ったものは何ですか?どこで買いましたか? これまでに旅行した国はどこですか? 最近の出来事で、腹が立ったことはなんですか?なぜですか? あなたにとっての記念日はい…

FacebookがKaggle上で開催しているコンテスト

https://www.kaggle.com/c/facebook-recruiting-iii-keyword-extraction Facebookがデータサイエンティストをリクルートするために開催しているコンテストの概要について読んでみました。 This competition tests your text skills on a large dataset from …

gitのトピックブランチをsvnのブランチにコミットする

gitでトピックブランチを作って作業していたものをsvnにブランチとしてコミットする方法。 $ git svn branch SomeFeature $ git branch -a master feature/SomeFeature remotes/SomeFeature $ git checkout feature/SomeFeature $ git rebase SomeFeature $ …

音楽の作り方

最近またLOVE PSYCHEDELICOをよく聴いてたので、なんとなく動画でもみてみるかってことで YouTubeで検索して見つけた今から約3年前くらいのラジオ番組の動画。 どのように音を録り、歌を加えて、楽曲に仕上げるのかの話で、要約すれば 「音楽の作り方(LOVE …

pythonでWord Cloud

scikit-learnの作者が作ったpythonのWord Cloudモジュールを使ってみたメモ。 README.mdにしたがって設定すれば特に難しいことはないと思われます。 必要なものを事前に入れておく $ pip install PIL $ pip install numpy $ pip install Cython $ pip instal…

MarkedでGithub Flavored Markdownを使う

Markdownのプレビューのために、vim-quickrunとMarkedでmarkdown編集が快適になった - Glide Note - グライドノートで 紹介されてたMarkedを買って使っています。 Github Flavored MarkdownのFenced code blockやSyntax highlighting(ソースコードに色付け…

はたらきたい展を見てきたよ

渋谷のパルコミュージアムで開催されているはたらきたい展に行ってきた。 HP見てもらうと詳しい展示内容がわかりますが、展示はその1からその6まであって、 スペースはそんなに広いわけではないですが、じっくり見ていると2,3時間はすぐにたっちゃう位に中身…

クレジットカード情報流出を聞いてカード再発行の手続きをしたのでまとめた

不正アクセスによるお客様情報流出に関するお知らせとお詫び ここ数日話題になっているクレジットカード情報流出の件。 メールがGmailに届いていて、見事に対象期間に当てはまっていたので、再発行の手続きをしてきた。 gistに再発行するためにやったことを…

TopCoderのSRMに参加するときに困ったこと

TopCoderのSRMに初めて参加した。 問題を解くよりも、そもそもSRMのページに辿り着けなかったり、 Javaはインストールしているのに、Javaがインストールされてませんって出たりして、 準備する方がとても難しかった。 そこで、初参加するときに困ったことと…

Lean Analyticsのまとめ(1)

Lean Analytics: Use Data to Build a Better Startup Faster作者: Alistair Croll,Benjamin Yoskovitz出版社/メーカー: O'Reilly Media発売日: 2013/03/08メディア: Kindle版この商品を含むブログを見るLean Analyticsを読んでいます。すべて読んでからまと…

Build you own summaryのまとめ

文章要約アルゴリズムについて、興味深いブログ記事があって読んでみたのでまとめてみる。Build your own summary tool! | The Tokenizerアルゴリズムのquick overviewとhands on exercise, python implementationについての内容。コードはgistで公開されて…

2013年GWに読みたい本

既に読み始めているのもあるけれど、GW中に読みたい本を5冊挙げてみる。 Lean Analytics リーンスタートアップの拡張版的位置づけの本。 リーンスタートアップのコアコンセプトの一つ、Build - Measure - Learnのサイクルのうち、 Measurenステージにフォー…

ビッグデータ競争元年

Harvard Business Review (ハーバード・ビジネス・レビュー) 2013年 02月号 [雑誌]出版社/メーカー: ダイヤモンド社発売日: 2013/01/10メディア: 雑誌購入: 2人 クリック: 3回この商品を含むブログを見る アルゴリズムが向上したのではない。データ量が増え…

rubyで日付の比較

昨日の課題をrubyで実装してみました。 日付の計算には、active_supportを使います。Rubyで日付の計算するならactive_support使っとけ - (゚∀゚)o彡 sasata299's blog一つ注意するのは、 require 'active_support' ではなく、 require 'active_support/all' と…

pythonのdatetimeとdateutilを使って日付を比較

月毎のフォルダにバックアップを保存している状況で、一定期間経過して古くなったフォルダを 消すことを考える。例えば、半年より前のフォルダは削除のように。pythonでは、datetimeとdateutilのrelativedeltaを使って日付の比較が出来る。 #-*- encoding: u…

機械との競争を読んだ

機械との競争作者: エリク・ブリニョルフソンMITスローンスクール経済学教授),アンドリュー・マカフィー(MITスローンスクール),村井章子出版社/メーカー: 日経BP社発売日: 2013/02/07メディア: 単行本購入: 4人 クリック: 43回この商品を含むブログ (5件) を…

ajaxなkindle highlightのページからハイライトを取得する

rubyでkindle highlightを抜き出すライブラリを参考にして、pythonで スクレイピングするスクリプトを書いてみました。mechanizeとlxmlを使っています。 highlightのページは、複数の書籍でハイライトが保存されていると、書籍毎にハイライトを 動的ロードす…

pythonとmatplotlibでkmeansクラスタリングを試す

kmeansクラスタリングをpythonとmatplotlibで試してみました。kmeansクラスタリングとは、教師なしデータ分類手法の一つ。 始めに、ランダムにk個の重心を配置し、 # ranges: dataの各次元の最小値[i][0]と最大値[i][1] ranges = [ (min([ d[i] for d in dat…

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all() について

pythonでnumpyを使ったプログラミングをしていてエラーの意味がわからなくて ハマったのでメモ。やりたいことは、配列同士の比較して一致してるかどうかを判定すること。 data = [1,2] data2 = [1,3] data == data2 => False bool(data == data2) => False n…

cygwinのgitでgit diffの文字化けを解消する

自分のところで確認できた方法は次の二つ。 1. lvを使う $ git config --global core.pager "lv -c" OOPSが出る場合は以下も設定 $ export TERM=cygwin 2. nkfを使う $ git config --global core.pager "nkf -w | less" ^Mが残る場合は以下のように設定 $ gi…

Rでk-Neareset Neighbor

Machine Learning for Hackersの第十章にあるk最近傍法をRでやってみた。k-nearest neighbor algorithm - Wikipedia, the free encyclopedia特徴空間において、クエリに対するk個の最近傍点のうち、最も頻度の高い点のラベルを割り当てる。 距離計算はユーク…

rubyでSIFTの対応点探索による画像のマッチング

solem's vision blog: Another Python Interface for SIFTこれと同じ事をrubyでやってみた。 SIFT特徴量の計算自体はvlfeatというライブラリを使っていて、特徴量に基づいて 対応する点を探索したり、画像上にプロットしたりをrubyからやっている。左側の画…