パパパパパパパパパ 2015/06/30 パパパパパパパパパパパパパパパパパパパパパ パパパパパパ。
パソコン部活動報告2015/06/30
最新の技術をとりあえず試してみることを目的とした部です。
2015/06月活動内容
1. Rとは2. AWSに Rをインストール3. AWSに RStudioいれる4. Rを動かしてみる5.終わり
Rは別に最新の技術ではないけど、ビックデータをグイングインさせていい感じに分析する時代になっているのでやってみる。
今回は環境作ったり初歩的なことを勉強してみる。
あと今回からフォントを変えました!
1.Rとは
R言語(あーるげんご)はオープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境である。R言語はニュージーランドのオークランド大学のRoss Ihakaと Robert Clifford Gentlemanにより作られた。現在では R Development Core Team(S言語開発者である John M. Chambersも参画している [1]。)によりメンテナンスと拡張がなされている。なお、 R言語の仕様を実装した処理系の呼称名はプロジェクトを支援するフリーソフトウェア財団によれば『 GNU R』である [2]が、他の実装形態が存在しないために日本語での慣用的呼称に倣って、当記事では、仕様・実装を纏めて適宜にR言語や単に R等と呼ぶ。
http://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E
1.Rとは
ほほう。ん?
及びその開発実行環境??
1.Rとは
視覚的にデータを分析出来るようプロットできる。また、グラフには多くの種類があり、棒グラフやヒストグラム、箱ひげ図、時系列プロットなどが用意されていいる。
視覚的アプローチ
多くの標準的な統計手法を標準でサポートし、それらを簡単なコマンドで実行できる。様々なデータを数式モデル化することで未来に発生するデータを予測することもできる。
統計解析的アプローチ
「 R」っていった場合、データ処理を行う CUIベースのプラットフォームって定義になるのね。やはり中身は Cで書かれているみたい。 Cは偉大ですよね。大きく分けてできることは 2つ。
1.Rとは
視覚的アプローチはなんとなくわかる。分析した結果を各種グラフで表現できる機能が標準で備わっているってことだよね。D3とか使わなくてもある程度はできるのかも。
統計解析的アプローチは言葉で聞くと、ふ~んって感じだけど、そもそも統計学がわからないからいまいち、ピンとこないね。
2.AWSに Rをインストール
AWSのブログを参考に Rをインストールしてみる。
echo 'deb http://cran.cnr.Berkeley.edu/bin/linux/ubuntu precise/' | sudo tee -a /etc/apt/sources.listsudo apt-get updatesudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9sudo apt-get install -y r-base
Rインストールコマンド
2.AWSに Rをインストール
ん??
2.AWSに Rをインストール
でたでた、だいたい失敗するよね。まぁ、知識が足りないせいもあるだろうけど。。。
lsb-releaseみてみると、 DISTRIB_CODENAMEがtrustyってなってるから、最初のコマンドで既にダメだったのね。。
赤字の部分が修正箇所ね。
echo 'deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu trusty/' | sudo tee -a /etc/apt/sources.listsudo apt-get updatesudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9sudo apt-get install -y r-base
Rインストールコマンド
2.AWSに Rをインストール
うまくいったっぽいので、SUDO Rしてみる。
2.AWSに Rをインストール
できたっぽいね。んじゃ、グラフ用パッケージをインストールする。
2.AWSに Rをインストール
できたっぽいね。んじゃ、グラフ用パッケージをインストールする。
install.packages("ggplot2", dep=TRUE)
グラフ用パッケージインストール
Selectionに 52(tokyo)と入力して Enter!!
ggplot2ってパッケージは複雑なグラフも簡単につくれちゃうパッケージ。軽くググってみたけど、情報量は多いのでなんとかなりそう。
2.AWSに Rをインストール
インストールが終わるまでしばらく待ちます。
2.AWSに Rをインストール
Redshiftにアクセスしやすくするためのパッケージも一応入れておく。Rを終了させるのは、 q()を打ってね。
あと、 gitから cloneするので gitもインストールしておくこと。
書き忘れてたけど、 OSは ubuntsです。
2.AWSに Rをインストール
RJDBCをインストール
sudo apt-get install openjdk-7-jdksudo R CMD javareconfsudo R>install.packages("RJDBC",dep=TRUE)
git clone https://github.com/pingles/redshift-r.gitsudo R>install.packages("/home/ubuntu/redshift-r", dependencies=T, repos=NULL, type="source")
Redshift for Rをインストール
3.AWSに RStudioを入れる
つか、 Rってコマンドラインからスクリプトを入力するとかまじめんどくさいんですけど( ^∀^ ) ゲラゲラ
いまどき IDEでやらないの??m9(^Д^) プギャーwwwwww
3.AWSに RStudioを入れる
ってなると思うので、 IDEを入れます。
ローカル PCではなく、 AWSに入れるのは時代は cloud型IDEだと勝手に思っているから。
後は、 PCに依存せずに Rやりたくなった時にできるのと、他のメンバーも気軽に Rに触れるようにするため。
3.AWSに RStudioを入れる
Nginxを proxyとしておいて 80番ポートでアクセスさせるようにしたいので、インストールしとく。
RStudio Serverインストール
sudo apt-get install gdebi-coresudo apt-get install libapparmor1 # Required only for Ubuntu, not Debianwget http://download2.rstudio.org/rstudio-server-0.98.501-amd64.debsudo gdebi rstudio-server-0.98.501-amd64.deb
3.AWSに RStudioを入れる
nginxをインストールしたら、 /etc/nginx/conf.dにあるdefault.confに設定を追加する。このときは rootになっておいてね。
locaction / {}の次に RStudio用の設定を追加してね。redirectURLは自分の好きなようにしてね。追加したら nginxを restartしてアクセスしてみる。
location /rstudio/ { rewrite ^/rstudio/(.*)$ /$1 break; proxy_pass http://localhost:8787; proxy_redirect http://localhost:8787/ $scheme://$host/rstudio/;}
default.confの追加内容RStudioの portは8787番です
3.AWSに RStudioを入れる
作成時の URLはhttp://ec2-52-68-206-27.ap-northeast-1.compute.amazonaws.com/rstudio/
んじゃ、アクセスしてみますかー。
※セキュリティグループで社内からしかアクセスできないようにしてます。
3.AWSに RStudioを入れる
でたー!!!!!
3.AWSに RStudioを入れる
ということで、ログインしてる。
3.AWSに RStudioを入れる
まぁ、わかってたけどね。。。。。
3.AWSに RStudioを入れる
そりゃ、ちゃんとユーザー作らないとだめだよね。
ちなみに rootで入ろうと試みましたw
3.AWSに RStudioを入れる
作成したユーザーでなら普通にログインできましたw
4.R動かしてみる
Rの入門的なブログみると、だいたいテキストを読み込んで結果を出すことをしていたけど、 AWS上に構築したRStudioでファイルをうまくアップロードできるのかなーって思ってたけど、普通に Uploadボタンがあって助かったw
画面右下のこれね。
4.R動かしてみるMarkeZinの某ブログを参考に動かしてみる。HOMEディレクトリに dataフォルダを作成してそこに読み込むファイルをアップロードして実行してます。ファイルを読み込む
sample<-read.table("data/sample.txt",header=T)
plotする
plot(sample)
4.R動かしてみる
楽ちんで結果がちゃんと出た。グラフは D3とかで作った方がおしゃれかも。
5. 終わり
今回構築した環境情報はこんな感じです。
AWS EC2 ubuntu14.04
RStudio Servernginx1.8.0
R3.2.0
ブラウザ
OS AWS EC2 ubuntu14.04
プロキシサーバー ginx1.8.0
R 3.2.0
IDE RStudio Server
5. 終わり
RやってみだけどほんとはUnityでゲームをつくりたいんだー!!!!!!!!!!
一緒にクソゲー作ってくれる人募集中。。。