Top Banner
28

Rで代数統計 TokyoR #42 LT

May 21, 2015

Download

Data & Analytics

motivic

Rで代数統計 TokyoR #42 LT algstat 2014/08/30
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Rで代数統計 TokyoR #42 LT
Page 2: Rで代数統計 TokyoR #42 LT

自己紹介

•なまえ:TORU IMAI

•ついったー: @MOTIVIC_

•しごと:株式会社ALBERT 主任研究員

•きょうみ:因果推論、代数統計、情報幾何、トポロジカルデータ解析

•今週LTしたDEEP LEARNINGの性能評価が思った以上に好評だった

Page 3: Rで代数統計 TokyoR #42 LT

分割表の検定ってありますよね

Page 4: Rで代数統計 TokyoR #42 LT

例えばABテストで広告の効果があったかを検証

商品A 買った 買ってない

広告表示なし 3 1000

広告表示あり 7 1100

Page 5: Rで代数統計 TokyoR #42 LT

カイ二乗検定で良いんでしょ?

Page 6: Rで代数統計 TokyoR #42 LT

カイ二乗検定で良いんでしょ?

このメッセージが出なければOKってものでもない

Page 7: Rで代数統計 TokyoR #42 LT

•分割表がスパースな場合

•行和や列和が均等でなく偏りがある場合

には漸近分布を用いる検定は良くない

(例えばHABERMAN(1988, JASA)など)

Page 8: Rで代数統計 TokyoR #42 LT

FISHER‘S EXACT TESTは?

Page 9: Rで代数統計 TokyoR #42 LT

FISHER‘S EXACT TESTは?

サンプルサイズや分割表のサイズが

大きいと計算がつらたん

Page 10: Rで代数統計 TokyoR #42 LT

漸近分布が使えずサンプルサイズが大きい場合はどうするの?

Page 11: Rで代数統計 TokyoR #42 LT

漸近分布が使えずサンプルサイズが大きい場合はどうするの?

皆大好きMCMC!

Page 12: Rで代数統計 TokyoR #42 LT

•2元分割表であれば簡単にMCMCでP値の計算が可能

•3元以上の分割表は?

•“マルコフ基底”を見つけるのが難しい

•簡単に見つける方法はないか?

Page 13: Rで代数統計 TokyoR #42 LT

代数統計

使えばいいよ

Page 14: Rで代数統計 TokyoR #42 LT

代数統計

使えばいいよ

一度だけなら

Page 15: Rで代数統計 TokyoR #42 LT

色んなソフトを使って何とか計算できた

Page 16: Rで代数統計 TokyoR #42 LT

でも次第に

代数統計のこと

しか考えられなく

なります

Page 17: Rで代数統計 TokyoR #42 LT

もっと楽に

代数統計を

使いたい!

Page 18: Rで代数統計 TokyoR #42 LT

Rで

代数統計を

Page 19: Rで代数統計 TokyoR #42 LT
Page 20: Rで代数統計 TokyoR #42 LT

C++MCMC

マルコフ

基底

Page 21: Rで代数統計 TokyoR #42 LT

マルコフ基底

MCMC

Page 22: Rで代数統計 TokyoR #42 LT

3元分割表での例

Page 23: Rで代数統計 TokyoR #42 LT

Rで代数統計が

できるようになった

Page 24: Rで代数統計 TokyoR #42 LT
Page 25: Rで代数統計 TokyoR #42 LT

2014/08/30アクセス

組織の陰謀により消されました

Page 26: Rで代数統計 TokyoR #42 LT

またいつかRで

代数統計を

使いたい!

Page 27: Rで代数統計 TokyoR #42 LT

参考文献

• JST CREST 日比チーム(編) (2011). グレブナー道場. 共立出版.

• S. AOKI, H. HARA, AND A. TAKEMURA (2012). MARKOV BASES IN ALGEBRAIC STATISTICS,

SPRINGER.

• S. J. HABERMAN (1988). A WARNING ON THE USE OF CHI-SQUARED STATISTICS WITH FREQUENCY TABLES WITH SMALL EXPECTED CELL COUNTS. JOURNAL OF THE AMERICAN STATISTICAL ASSOCIATION, 83, 555–560.

Page 28: Rで代数統計 TokyoR #42 LT

代数統計とか興味あるなら

ALBERTで一緒に働かない?