R in life science ~R でででででででで ~ YOSHIKI TOMITA
R in life science~R で分散分析の基礎 ~YOSHIKI TOMITA
なますて!
複数の群を含むデータを比較したい
Dataset “chickwts” を例に群 餌 英名 その餌を食べて 6 週間育った鶏の体重
(g)例数
1 カゼイン casein 368, 390, 379, 260, 404, 318, 352, 359, 216, 222, 283, 332 12
2 ソラマメ horsebean 179, 160, 136, 227, 217, 168, 108, 124, 143, 140 10
3 アマニの種 linseed 309, 229, 181, 141, 260, 203, 148, 169, 213, 257, 244, 271 12
4 肉の配合餌 meatmeal 325, 257, 303, 315, 380, 153, 263, 242, 206, 344, 258 11
5 大豆 soybean243, 230, 248, 327, 329, 250, 193, 271, 316, 267, 199, 171, 158, 248
14
6 ヒマワリの種 sunflower 423, 340, 392, 339, 341, 226, 320, 295, 334, 322, 297, 318 12
まずはデータを観察
グラフを観察
グラフを観察
平均値と 95% 信頼区間のグラフ。平均には差がありそう。分散は?(等分散が仮定できるか)。
等分散性の検定(バートレット検定)
P-value = 0.66 >0.05 より帰無仮説が棄却されない(分散に差があるとは言えない)。→ 等分散とみなして ANOVA にかける。
一元配置分散分析
分散分析から多重比較へ ANOVA (分散分析):どの群とどの群に有意差があるのかまではわからない。 多重比較:どの群とどの群が同じ / 違うのかを検定できる( Tukey の HSD 検定など)。
各種検定方法はデータの分布、等分散性、対応関係、サンプル数などの条件から選択する。
Turkey の HSD 検定
参考文献・ブログなど バイオ実験に絶対使える統計の基本 Q&A (監修:秋山徹、羊土社) バイオインフォマティクス入門 http://bio-info.biz/
R によるデータの統計的取り扱い / 3つ以上の平均の比較 http://igproj.com/zone1/index.php?FrontPage
R 言語で統計解析入門 http://monge.tec.fukuoka-u.ac.jp/r_analysis/0r_analysis