Top Banner
パパパパパパパパパ 2015/06/30 パパパパパパパパパパパパパパパパパパパパパ パパパパパパ
30

活動報告8 r入門-

Aug 16, 2015

Download

Engineering

vx-pc-club
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 活動報告8  r入門-

パソコン部活動報告2015/06/30

最新の技術をとりあえず試してみることを目的とした部です。

Page 2: 活動報告8  r入門-

2015/06月活動内容

1. Rとは2. AWSに Rをインストール3. AWSに RStudioいれる4. Rを動かしてみる5.終わり

Rは別に最新の技術ではないけど、ビックデータをグイングインさせていい感じに分析する時代になっているのでやってみる。

今回は環境作ったり初歩的なことを勉強してみる。

あと今回からフォントを変えました!

Page 3: 活動報告8  r入門-

1.Rとは

R言語(あーるげんご)はオープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境である。R言語はニュージーランドのオークランド大学のRoss Ihakaと Robert Clifford Gentlemanにより作られた。現在では R Development Core Team(S言語開発者である John M. Chambersも参画している [1]。)によりメンテナンスと拡張がなされている。なお、 R言語の仕様を実装した処理系の呼称名はプロジェクトを支援するフリーソフトウェア財団によれば『 GNU R』である [2]が、他の実装形態が存在しないために日本語での慣用的呼称に倣って、当記事では、仕様・実装を纏めて適宜にR言語や単に R等と呼ぶ。

http://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E

Page 4: 活動報告8  r入門-

1.Rとは

ほほう。ん?

及びその開発実行環境??

Page 5: 活動報告8  r入門-

1.Rとは

視覚的にデータを分析出来るようプロットできる。また、グラフには多くの種類があり、棒グラフやヒストグラム、箱ひげ図、時系列プロットなどが用意されていいる。

視覚的アプローチ

多くの標準的な統計手法を標準でサポートし、それらを簡単なコマンドで実行できる。様々なデータを数式モデル化することで未来に発生するデータを予測することもできる。

統計解析的アプローチ

「 R」っていった場合、データ処理を行う CUIベースのプラットフォームって定義になるのね。やはり中身は Cで書かれているみたい。 Cは偉大ですよね。大きく分けてできることは 2つ。

Page 6: 活動報告8  r入門-

1.Rとは

視覚的アプローチはなんとなくわかる。分析した結果を各種グラフで表現できる機能が標準で備わっているってことだよね。D3とか使わなくてもある程度はできるのかも。

統計解析的アプローチは言葉で聞くと、ふ~んって感じだけど、そもそも統計学がわからないからいまいち、ピンとこないね。

Page 7: 活動報告8  r入門-

2.AWSに Rをインストール

AWSのブログを参考に Rをインストールしてみる。

echo 'deb http://cran.cnr.Berkeley.edu/bin/linux/ubuntu precise/' | sudo tee -a /etc/apt/sources.listsudo apt-get updatesudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9sudo apt-get install -y r-base

Rインストールコマンド

Page 8: 活動報告8  r入門-

2.AWSに Rをインストール

ん??

Page 9: 活動報告8  r入門-

2.AWSに Rをインストール

でたでた、だいたい失敗するよね。まぁ、知識が足りないせいもあるだろうけど。。。

lsb-releaseみてみると、 DISTRIB_CODENAMEがtrustyってなってるから、最初のコマンドで既にダメだったのね。。

赤字の部分が修正箇所ね。

echo 'deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu trusty/' | sudo tee -a /etc/apt/sources.listsudo apt-get updatesudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9sudo apt-get install -y r-base

Rインストールコマンド

Page 10: 活動報告8  r入門-

2.AWSに Rをインストール

うまくいったっぽいので、SUDO Rしてみる。

Page 11: 活動報告8  r入門-

2.AWSに Rをインストール

できたっぽいね。んじゃ、グラフ用パッケージをインストールする。

Page 12: 活動報告8  r入門-

2.AWSに Rをインストール

できたっぽいね。んじゃ、グラフ用パッケージをインストールする。

install.packages("ggplot2", dep=TRUE)

グラフ用パッケージインストール

Selectionに 52(tokyo)と入力して Enter!!

ggplot2ってパッケージは複雑なグラフも簡単につくれちゃうパッケージ。軽くググってみたけど、情報量は多いのでなんとかなりそう。

Page 13: 活動報告8  r入門-

2.AWSに Rをインストール

インストールが終わるまでしばらく待ちます。

Page 14: 活動報告8  r入門-

2.AWSに Rをインストール

Redshiftにアクセスしやすくするためのパッケージも一応入れておく。Rを終了させるのは、 q()を打ってね。

あと、 gitから cloneするので gitもインストールしておくこと。

書き忘れてたけど、 OSは ubuntsです。

Page 15: 活動報告8  r入門-

2.AWSに Rをインストール

RJDBCをインストール

sudo apt-get install openjdk-7-jdksudo R CMD javareconfsudo R>install.packages("RJDBC",dep=TRUE)

git clone https://github.com/pingles/redshift-r.gitsudo R>install.packages("/home/ubuntu/redshift-r", dependencies=T, repos=NULL, type="source")

Redshift for Rをインストール

Page 16: 活動報告8  r入門-

3.AWSに RStudioを入れる

つか、 Rってコマンドラインからスクリプトを入力するとかまじめんどくさいんですけど( ^∀^ ) ゲラゲラ

いまどき IDEでやらないの??m9(^Д^) プギャーwwwwww

Page 17: 活動報告8  r入門-

3.AWSに RStudioを入れる

ってなると思うので、 IDEを入れます。

ローカル PCではなく、 AWSに入れるのは時代は cloud型IDEだと勝手に思っているから。

後は、 PCに依存せずに Rやりたくなった時にできるのと、他のメンバーも気軽に Rに触れるようにするため。

Page 18: 活動報告8  r入門-

3.AWSに RStudioを入れる

Nginxを proxyとしておいて 80番ポートでアクセスさせるようにしたいので、インストールしとく。

RStudio Serverインストール

sudo apt-get install gdebi-coresudo apt-get install libapparmor1 # Required only for Ubuntu, not Debianwget http://download2.rstudio.org/rstudio-server-0.98.501-amd64.debsudo gdebi rstudio-server-0.98.501-amd64.deb

Page 19: 活動報告8  r入門-

3.AWSに RStudioを入れる

nginxをインストールしたら、 /etc/nginx/conf.dにあるdefault.confに設定を追加する。このときは rootになっておいてね。

locaction / {}の次に RStudio用の設定を追加してね。redirectURLは自分の好きなようにしてね。追加したら nginxを restartしてアクセスしてみる。

location /rstudio/ { rewrite ^/rstudio/(.*)$ /$1 break; proxy_pass http://localhost:8787; proxy_redirect http://localhost:8787/ $scheme://$host/rstudio/;}

default.confの追加内容RStudioの portは8787番です

Page 20: 活動報告8  r入門-

3.AWSに RStudioを入れる

作成時の URLはhttp://ec2-52-68-206-27.ap-northeast-1.compute.amazonaws.com/rstudio/

んじゃ、アクセスしてみますかー。

※セキュリティグループで社内からしかアクセスできないようにしてます。

Page 21: 活動報告8  r入門-

3.AWSに RStudioを入れる

でたー!!!!!

Page 22: 活動報告8  r入門-

3.AWSに RStudioを入れる

ということで、ログインしてる。

Page 23: 活動報告8  r入門-

3.AWSに RStudioを入れる

まぁ、わかってたけどね。。。。。

Page 24: 活動報告8  r入門-

3.AWSに RStudioを入れる

そりゃ、ちゃんとユーザー作らないとだめだよね。

ちなみに rootで入ろうと試みましたw

Page 25: 活動報告8  r入門-

3.AWSに RStudioを入れる

作成したユーザーでなら普通にログインできましたw

Page 26: 活動報告8  r入門-

4.R動かしてみる

Rの入門的なブログみると、だいたいテキストを読み込んで結果を出すことをしていたけど、 AWS上に構築したRStudioでファイルをうまくアップロードできるのかなーって思ってたけど、普通に Uploadボタンがあって助かったw

画面右下のこれね。

Page 27: 活動報告8  r入門-

4.R動かしてみるMarkeZinの某ブログを参考に動かしてみる。HOMEディレクトリに dataフォルダを作成してそこに読み込むファイルをアップロードして実行してます。ファイルを読み込む

sample<-read.table("data/sample.txt",header=T)

plotする

plot(sample)

Page 28: 活動報告8  r入門-

4.R動かしてみる

楽ちんで結果がちゃんと出た。グラフは D3とかで作った方がおしゃれかも。

Page 29: 活動報告8  r入門-

5. 終わり

今回構築した環境情報はこんな感じです。

AWS EC2 ubuntu14.04

RStudio Servernginx1.8.0

R3.2.0

ブラウザ

OS AWS EC2 ubuntu14.04

プロキシサーバー ginx1.8.0

R 3.2.0

IDE RStudio Server

Page 30: 活動報告8  r入門-

5. 終わり

RやってみだけどほんとはUnityでゲームをつくりたいんだー!!!!!!!!!!

一緒にクソゲー作ってくれる人募集中。。。