Rでタブ区切りのデータを取得する方法。
基本的には、テーブル形式のデータを読み込むfunctionを使用するだけ。
タブ区切りのデータの時には、read.delimが使える。
> ufo<-read.delim("data/ufo/ufo_awesome.tsv", sep='¥t', header=FALSE, stringsAsFactor=FALSE)
最初の引数はデータファイルの相対パス。ちなみに、Machine Learning for Hackersで紹介されてるUFOの目撃情報データ。
johnmyleswhite/ML_for_Hackers · GitHub
sepはデフォルトで'¥t'なので省略可能。あと、header=FALSEは一行目を
ヘッダ行として使用しないという指定、
stringsAsFactors=FALSEは文字列からfactorへの変換しないという設定。
headすると、時期とどれくらいの時間見られたのか?といったデータが表示されます。
(レイアウトが崩れてるけど、V1からV6の六列)
> head(ufo) V1 V2 V3 V4 V5 1 19951009 19951009 Iowa City, IA 2 19951010 19951011 Milwaukee, WI 2 min. 3 19950101 19950103 Shelton, WA 4 19950510 19950510 Columbia, MO 2 min. 5 19950611 19950614 Seattle, WA 6 19951025 19951024 Brunswick County, ND 30 min. V6 1 Man repts. witnessing "flash, followed by a classic UFO, w/ a tailfin at back." Red color on top half of tailfin. Became triangular. 2 Man on Hwy 43 SW of Milwaukee sees large, bright blue light streak by his car, descend, turn, cross road ahead, strobe. Bizarre! 3 Telephoned Report:CA woman visiting daughter witness discs and triangular ships over Squaxin Island in Puget Sound. Dramatic. Written report, with illustrations, submitted to NUFORC. 4 Man repts. son's bizarre sighting of small humanoid creature in back yard. Reptd. in Acteon Journal, St. Louis UFO newsletter. 5 Anonymous caller repts. sighting 4 ufo's in NNE sky, 45 deg. above horizon. (No other facts reptd. No return tel. #.) 6 Sheriff's office calls to rept. that deputy, 20 mi. SSE of Wilmington, is looking at peculiar, bright white, strobing light.
Rコンソールを使うときは、setwd()やgetwd()が必要になるので、覚えておくと良いかも。
> getwd() [1] "/Users/satojkovic/projects/ML_for_Hackers/01-Introduction" > dir() > setwd('data/') > dir() [1] "census.csv" "ufo"
などなど。