Top Banner
A. Asano, Kansai Univ. 2016年度秋学期 統計学 浅野 晃 関西大学総合情報学部 データの関係を知る(1)相関関係と因果関係 第6回
121

2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

Jan 20, 2017

Download

Education

Akira Asano
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

2016年度秋学期 統計学

浅野 晃 関西大学総合情報学部

データの関係を知る(1)相関関係と因果関係

第6回

Page 2: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

Page 3: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

多変量データと多変量解析

Page 4: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

変量とは日本男性の身長は分布する

分布する量を[変量]という

統計学は, 分布している変量から情報を引き出す 手法

Page 5: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

Page 6: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

Page 7: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

Page 8: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

Page 9: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

Page 10: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

変量

Page 11: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

変量 変量

Page 12: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

変量 変量 変量

Page 13: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

「入学試験の点数」←数学・英語・国語…

変量 変量 変量[多変量データ]  という

Page 14: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

「多」変量とは2つ以上の変量の組み合わせで 表現されるデータ

多変量データを扱う統計学を [多変量解析]という

「入学試験の点数」←数学・英語・国語…

変量 変量 変量[多変量データ]  という

Page 15: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

多変量解析では変量の間の関係が問題になる

…という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

たとえば

この傾向を見つけるのが,[相関分析]             [回帰分析]

Page 16: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

Page 17: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

相関関係と散布図

Page 18: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

Page 19: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

Page 20: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

Page 21: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

Page 22: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

[正の相関関係]

Page 23: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

[正の相関関係]

Page 24: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

[正の相関関係]

Page 25: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関関係2つの変量からなるデータを考える

という傾向にある

数学の点数の高い人は 英語の点数も高い数学の点数の高い人は 国語の点数が低い

さっきの

変量どうしの互いの増減の傾向 [相関関係]

[正の相関関係]

[負の相関関係]

Page 26: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40.82 9.6

秋田 39.72 11.0

仙台 38.27 11.9

福島 37.75 12.5

宇都宮 36.55 12.9

水戸 36.38 13.2

東京 35.68 15.3

新潟 37.92 13.1

長野 36.67 11.4

静岡 34.97 16.0

名古屋 35.17 14.9

大阪 34.68 16.2

鳥取 35.48 14.4

広島 34.40 15.0

高知 33.55 16.3

福岡 33.92 16.0

鹿児島 31.57 17.3

那覇 26.20 22.0

表 1: 日本の都市の緯度と気温

     

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

Page 27: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

Page 28: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量

Page 29: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量

変量

Page 30: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

Page 31: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 32: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 33: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 34: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 35: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 36: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 37: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

Page 38: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図多変量データを目に見えるように描く

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

地名 緯度(度) 気温(℃)札幌 43.05 8.0

青森 40 82 9 6

     

変量 変量

変量

変量

札幌

Page 39: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図と相関関係

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

Page 40: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図と相関関係

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

Page 41: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図と相関関係

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

右下がりに並ぶ

Page 42: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図と相関関係

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

右下がりに並ぶ緯度が上がると 気温が下がる傾向

Page 43: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

散布図と相関関係

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

右下がりに並ぶ緯度が上がると 気温が下がる傾向

負の相関関係

Page 44: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関の強弱参考資料の散布図(47都道府県について)

「統計学入門」(東京大学出版会) 44ページの図(さまざまな散布図の例)を示して,

相関の強弱や無相関について, スライド2枚にわたって説明しました。

Page 45: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

Page 46: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

共分散と相関係数

Page 47: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

ここからは,緯度・気温ではなく一般的に

Page 48: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

ここからは,緯度・気温ではなく一般的に

Page 49: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

ここからは,緯度・気温ではなく一般的に

Page 50: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

xi

ここからは,緯度・気温ではなく一般的に

Page 51: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

xi

yi

ここからは,緯度・気温ではなく一般的に

Page 52: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

(xi, yi)

xi

yi

ここからは,緯度・気温ではなく一般的に

Page 53: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

(xi, yi)

xi

yi

x

ここからは,緯度・気温ではなく一般的に

Page 54: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

(xi, yi)

xi

yi

x

y

ここからは,緯度・気温ではなく一般的に

Page 55: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数相関の正負・強弱を数字で表す

��

���

��

��

5

7

9

11

13

15

17

19

21

23

25 27 29 31 33 35 37 39 41 43 45

気温(℃)

緯度(度)

     

x

y

(xi, yi)

xi

yi

x

y

xy

x だけの平均y だけの平均

ここからは,緯度・気温ではなく一般的に

Page 56: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

(nはデータサイズ)

Page 57: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

(nはデータサイズ)

Page 58: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均

(nはデータサイズ)

Page 59: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

(nはデータサイズ)

Page 60: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散(nはデータサイズ)

Page 61: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差 (nはデータサイズ)

Page 62: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差 (nはデータサイズ)

Page 63: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差

y の標準偏差

(nはデータサイズ)

Page 64: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差

y の標準偏差

(nはデータサイズ)

x の偏差

Page 65: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差

y の標準偏差

(nはデータサイズ)

x の偏差 y の偏差

Page 66: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

相関係数

rxy =

∑ni=1(xi − x)(yi − y)/n√∑n

i=1(xi − x)2/n√∑n

i=1(yi − y)2/n

     

[相関  係数]

x の平均x の偏差

x の分散x の標準偏差

y の標準偏差

(nはデータサイズ)

x,y の[共分散]

x の偏差 y の偏差

Page 67: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

x,y の共分散x の偏差 y の偏差

∑ni=1(xi − x)(yi − y)/n

     

x

y

イロ

ハ ニ

イ・ロ・ハ・ニで

(xi − x)(yi − y)

     

の値はどうなる?x

y

y

x

(イ)(ロ)

(ハ) (ニ)

Page 68: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

x

y

y

x

(イ)(ロ)

(ハ) (ニ)

共分散の意味

x

yイ

(xi, yi)

+

(xi, yi) が「イ」の領域にあるとすると

xi − x > 0,

     

xi

yi

yi − y > 0で

     

(xi − x)(yi − y) > 0

     

Page 69: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

x

y

y

x

(イ)(ロ)

(ハ) (ニ)

共分散の意味

x

y

(xi, yi)

+

(xi, yi) が「ハ」の領域にあるとすると

xi

yi

(xi − x)(yi − y) > 0

     

xi− x < 0,

     

yi− y < 0

     

Page 70: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

(xi, yi) の 場所によって

x

yイロ

ハ ニx

y

y

x

(イ)(ロ)

(ハ) (ニ)

(xi − x)(yi − y) > 0

     

(xi − x)(yi − y) > 0

     

(xi − x)(yi − y) < 0

     

(xi − x)(yi − y) < 0

     

(xi, yi) が (x, y)から離れているほど, 絶対値が大きくなる

Page 71: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 72: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 73: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 74: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 75: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 76: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 77: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 78: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 79: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 80: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

Page 81: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味

正で大きな値 →強い正の相関

∑ni=1(xi − x)(yi − y)/n

     

x

y

y

x

     

x

y

x

y

x

y

y

x

     

負で絶対値が大きい →強い負の相関

Page 82: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散の意味∑n

i=1(xi − x)(yi − y)/n

     

x

y

差し引きゼロ →無相関

xx

y

y

     

Page 83: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

共分散と相関係数

これらの相関の強さは同じ →標準偏差で割って調整する

相関係数=共分散       ÷ (xの標準偏差 × yの標準偏差)

x

y

y

xx

y

y

x

     

相関係数は -1~0~1

Page 84: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

Page 85: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

ちょっと問題

Page 86: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題1国民所得と酒の消費量の間には正の相関 がある。だから,国民が酒をたくさん飲めば所得が増える。

Page 87: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題1国民所得と酒の消費量の間には正の相関 がある。だから,国民が酒をたくさん飲めば所得が増える。

相関関係と因果関係は異なる。

Page 88: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2ある電気製品の普及台数は,発売以来 毎年倍に増えている。発売後の年数と普及台数の相関係数は,非常に強い相関であるから,ほぼ1である。

Page 89: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2ある電気製品の普及台数は,発売以来 毎年倍に増えている。発売後の年数と普及台数の相関係数は,非常に強い相関であるから,ほぼ1である。

直線状の関係ではないから, 相関係数が1にはならない

Page 90: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 91: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 92: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 93: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 94: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 95: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

Page 96: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

直線の関係に ない

Page 97: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

直線の関係に ない

10

2013 14 15 16

20

40

80

台数(万台)

対数目盛りに変える (1目盛=「2倍」)

Page 98: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

直線の関係に ない

10

2013 14 15 16

20

40

80

台数(万台)

対数目盛りに変える (1目盛=「2倍」)

Page 99: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

問題2

1020

2013 14 15 16

40

60

80

台数(万台)

「毎年倍になっている」

直線の関係に ない

10

2013 14 15 16

20

40

80

台数(万台)

対数目盛りに変える (1目盛=「2倍」)

直線の関係に ある

Page 100: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

Page 101: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

Page 102: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

小学生については,身体が大きいと 試験の成績が良い

Page 103: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

小学生については,身体が大きいと 試験の成績が良い

???

Page 104: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

小学生については,身体が大きいと 試験の成績が良い

???

全学年の児童に同じ問題で試験をすれば。

Page 105: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

小学生については,身体が大きいと 試験の成績が良い

???

全学年の児童に同じ問題で試験をすれば。

「体格」と「成績」には正の相関関係

Page 106: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

小学生については,身体が大きいと 試験の成績が良い

???

全学年の児童に同じ問題で試験をすれば。

「体格」と「成績」には正の相関関係なぜ?

Page 107: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

Page 108: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

正の相関関係

Page 109: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

学年正の相関関係

Page 110: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

学年正の相関関係

正の相関関係 本当の因果関係

Page 111: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

学年正の相関関係

正の相関関係 本当の因果関係

正の相関関係 本当の因果関係

Page 112: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

みかけ上の相関

なぜ?

体格

成績

学年正の相関関係

正の相関関係 本当の因果関係

正の相関関係 本当の因果関係

みかけ上の

Page 113: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別成績

体格

     

正の相関関係

Page 114: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別実は成績

体格

     

正の相関関係

Page 115: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別実は成績

体格

     

正の相関関係

成績

体格

6年5年

4年3年

2年1年 層内の相関は

ない

     

Page 116: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別実は

内部に「学年」の 層がある

成績

体格

     

正の相関関係

成績

体格

6年5年

4年3年

2年1年 層内の相関は

ない

     

Page 117: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別

内部に「学年」の 層がある

成績

体格

6年5年

4年3年

2年1年 層内の相関は

ない

     

成績

体格

6年5年

4年3年

2年1年 各層を1か所に

まとめる

     

層に分けて, ひとつにまとめる

Page 118: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

層別

内部に「学年」の 層がある

成績

体格

6年5年

4年3年

2年1年 層内の相関は

ない

     

成績

体格

6年5年

4年3年

2年1年 各層を1か所に

まとめる

     

層に分けて, ひとつにまとめる

学年の影響を除いた[偏相関係数]

Page 119: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ところでこうはならないの?

体格

成績

学年

正の相関関係?

正の相関関係

みかけ上の

正の相関関係

Page 120: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ところでこうはならないの?

体格

成績

学年

正の相関関係?

正の相関関係

みかけ上の

正の相関関係

統計学の上では,こう考えても同じ

Page 121: 2016年度秋学期 統計学 第6回 データの関係を知る(1)-相関関係と因果関係 (2016. 10. 31)

2016年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

ところでこうはならないの?

体格

成績

学年

正の相関関係?

正の相関関係

みかけ上の

正の相関関係

統計学の上では,こう考えても同じならないのは,統計学以外の知識による