being qua being

情報的な何かと政治的な何か

統計学:Rを用いた入門書で使われているデータセット

ビッグデータというバズワードが流行り始めて2年くらい経ちますが、未だにビッグデータをうまく活用したインパクトある事例が出てこないのが気になります。ビッグデータというからには長年の大量のデータを解析する必要があるので、業界によってはマーケティングなどに活用して結果を観察するまでにまた時間がかかるものですが、未だに単語だけ先走ってる感は否めません。

統計学が最強の学問である

統計学が最強の学問である

 

 この本によりますと、統計学は最強の学問であるらしいのですが、それは理解できても統計の解析という実務は実際に手を動かしてデータを見てみないと身につかないものです。

データを扱うと言うとエクセルを思い浮かべます。エクセル自体も優秀な統計ソフトと言えますが、統計データを扱うプロたちはSPSSやStataのような専門のソフトを使うことが多いです。この理由は簡単に複雑な統計解析ができるからです。

しかしこれらのソフトは値段が高く、一般人が購入することは難しいでしょう。そこでエクセルに比べると少しハードルは高いですが、統計ソフトとしてはRというものがよく使われています。無料です。そこでRを学ぶ時に個人的におすすめしたい本は『統計学:Rを用いた入門書』です。 

統計学:Rを用いた入門書

統計学:Rを用いた入門書

 

この本は実際にRを動かして分析できますので、実践的で役に立ちます。ちなみにこの本で使われているデータセットは以下のサイトからダウンロードできます。

 

Statistics: An Introduction using R

http://www3.imperial.ac.uk/naturalsciences/research/statisticsusingr

 

日本人の生活価値観調査や選挙データなどに興味がある人は、東京大学の社会科学研究所アーカイブに様々なデータが公開されていますので、思う存分使ってみるといいかもしれません。

Social Science Japan Data Archive (SSJDA)

http://ssjda.iss.u-tokyo.ac.jp/