Top Banner
空間分析 空間分析 第5回 空間統計デ 空間統計デ1 空間統計デ 特性 1.空間統計デ特性 空間統計データには、ふつうの統計データに はない特性がある。 1.空間統計データの特性 (0)統計分析 (0)統計分析 1)標本 ところで、ふつうの統計分析は大丈夫? 平均とか、分散とか、標準偏差とか規分布か、相関係数とか、回帰分析とか、覚えています か? 例:入社5年目の平均給料 30万円 1.空間統計データの特性 (0)統計分析 (0)統計分析 1)標本 5 どちらも平均30万円 3 4 5 年功給与 30万円 分散が違う 1 2 上: 1.3 下:17.6 0 20 22 24 26 28 30 32 34 36 38 40 万円 5 3 4 5 実力主義 1 2 3 0 20 22 24 26 28 30 32 34 36 38 40 万円
10

1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

Sep 24, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

空間分析空間分析第5回

空間統計デ タ空間統計データ

1 空間統計デ タ 特性1.空間統計データの特性

》空間統計データには、ふつうの統計データにはない特性がある。

1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本

》ところで、ふつうの統計分析は大丈夫?

▷平均とか、分散とか、標準偏差とか、正規分布と▷平均 、分散 、標準偏差 、 規分布か、相関係数とか、回帰分析とか、覚えていますか?

》例:入社5年目の平均給料 30万円

1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本

5人

》どちらも平均は

30万円 3

4

5人年功給与

30万円

》分散が違う 1

2

▷上: 1.3

▷下:17.6

0

20 22 24 26 28 30 32 34 36 38 40万円

5人

3

4

5人

実力主義

1

2

3

0

20 22 24 26 28 30 32 34 36 38 40万円

Page 2: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本

標本(サンプル)と母集団(全体)の平均・分散は、ほぼ 致し る が前提ほぼ一致している、のが前提。

1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析2)相関

》 x(空港間の直線距離)と 500

min500min

空港間の所要時間(分)

線距y(空港間の所要時間)の

350

400

450

400

450

相関

》 R = 0 942 250

300

350

250

300

350

》 R 0.942

100

150

200

100

150

200

0

50

0 1,000 2,000 3,000 4,000 5,000 6,000k

0

50

100

0 1 000 2 000 3 000 4 000 5 000 6 000

k

km0 1,000 2,000 3,000 4,000 5,000 6,000

空港間の直線距離(km)

1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析2)相関

R =

1.空間統計データの特性(0)ふつうの統計分析(0)ふつうの統計分析

3)回帰分析

》 モデル=一般的な 500min500min

空港間の所要時間(分)》 デル 般的な

法則

》 もちろん、例外も350

400

450 y = 0.083x + 32.945

R² = 0.9423400

450

ある

250

300

350

250

300

350

100

150

200

100

150

200

0

50

0 1,000 2,000 3,000 4,000 5,000 6,000k

0

50

100

0 1 000 2 000 3 000 4 000 5 000 6 000

k

km0 1,000 2,000 3,000 4,000 5,000 6,000

空港間の直線距離(km)

Page 3: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある

SFC周辺の地価公示地点

1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある

》点の密度

▷一定の面積あたりの点の度数▷ 定 面積あたり 点 度数

1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある

》点の分布パターン

凝集型 ランダム型 均等型

1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある

》点分布パターン分析

▷区画法▷区画法› ランダムな点分布=点密度がポアソン分布

› 対象の点分布がランダムかどうかをχ2検定

Page 4: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある

》点分布パターン分析

▷最近隣距離法▷最近隣距離法› 点iについて、1番目~N番目に近い最近隣点を見つけ,各最近隣点までの距離diを測定

距離の平均値 により最近隣距離を定義› 距離の平均値rにより最近隣距離を定義

1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある

》直線距離

》ネットワーク距離》ネットワ ク距離

▷道のり

▷所要時間・運賃(駅すぱあと)▷所要時間 運賃(駅すぱあと)

》コスト距離

所要時間 時間価値 + 運賃等▷所要時間 x 時間価値 + 運賃等

1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある

》ネットワーク解析

▷ ArcGISのNetwork Analystで2点間のネットワーク▷ y 点間 ネッ ワ ク距離・コスト距離を計算できる。

1 空間統計データの特性

1)交通ネ トワ クデ タを構築する

1.空間統計デ タの特性(2)いろいろな距離がある

1)交通ネットワークデータを構築する

Global Mapping(ISCGM;2006)

Digital Chart of the World Data Server(ESRI;1993)(公開国・準備国)

Page 5: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある

1)交通ネ トワ クデ タを構築する1)交通ネットワークデータを構築する

道路

鉄道

1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある

1)交通ネ トワ クデ タを構築する

都市圏内は若干怪しいDigital Chart of the World Data Server

Gl b l M i

1)交通ネットワークデータを構築する

Global Mapping

•東海道新幹線が渋谷発

山手線が くな新宿 東京新宿 東京•山手線が円くない

•中央線・南武線・井の頭線・京葉線がない

中央林間 新横浜中央林間 新横浜

•小田急江ノ島線・相鉄線・田園都市線・横須賀線・常磐線が途切れて

湘南台

横浜

湘南台

横浜 いる

•武蔵野線が武蔵境発,西武多摩川線が田無発 西武新宿線が飯

藤沢藤沢発,西武新宿線が飯田橋発

•西武新宿線と池袋線が ぎはぎ

1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある

1)交通ネ トワ クデ タを構築する1)交通ネットワークデータを構築する

道路と航空路を接続

Hawth’s toolで

発着空港の座標csv

道路と航空路を接続

発着空港の座標csv

→航空路のラインshp 航空路

1 空間統計デ タ 特性1.空間統計データの特性(2)いろいろな距離がある

2)Network Analystで交通ネットワークを検索する

県庁

空港道路

航空

道路・航空を乗り継ぐルートの検索結果の例

東京からの加重平均移動コストの分布

Page 6: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する

》空間的自己相関

SFC周辺の公示地価

1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する

》空間的自己相関の強さを表す指標

▷例:Moran’s I▷例› ある地区属性の他の地区属性との共分散を元にした指標.

相関係数と同様に の間をとる› 相関係数と同様に,-1~1の間をとる

○ 1に近づくほど、同じような空間属性が配置されている

○ -1に近づくほど、異なった空間属性が配置されている、異 属 置

○ 0に近づくほど、空間属性がランダムに分布する

1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する

》空間統計データの自己相関を反映した回帰モデル

1)ふつうの回帰モデル)ふ う 回帰 デル

y:目的変数、X:説明変数、β:パラメータ、

ε:正規分布する誤差項

1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する

》空間統計データの自己相関を反映した回帰モデル

2)時系列統計データの自己相関を反映した回帰モデル)時系列統計デ タ 自 相関を反映した回帰 デル

例:ことしのGDPは去年のGDPに相関する

ρ:パラメータρ ラ タ

Page 7: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する

》空間統計データの自己相関を反映した回帰モデル

3)空間統計データの自己相関を反映した回帰モデル)空間統計デ タ 自 相関を反映した回帰 デル

例:地価は近隣の地価と相関する

SARモデルの場合、SARモデルの場合、

W:空間重みづけ行列

1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる

》ふつうの統計データの場合:線形補間

2000 2002 2005ここの値を推計

2000 2002 2005

1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる

》空間統計データの場合:空間補間

ここの値を推計ここの値を推計

1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる

》空間統計データの場合:空間補間

▷例:クリギング▷例 クリギング

Page 8: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる

》空間統計データの場合:空間補間

▷例:クリギング▷例 クリギング› ラグランジュ未定乗数法なので、逆行列を解けばいい。

1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる

》空間統計データの場合:空間補間

▷クリギング▷クリギング

2 主題図 トリ ク2.主題図のトリック

》昭和生まれ? 平成生まれ?

1920

1930若くない

1940

1950

1960

若くない

昭和生まれ1960

1970

1980

20世紀生まれ昭和生まれ

1980

1990

2000

若い2000

201021世紀生まれ

平成生まれ

2 主題図 トリ ク2.主題図のトリック

》空間的パターンの分類方法の選び方

自然分類 標準偏差 等間隔 等量町丁目別人口密度

分類手法が変わると、同じ分類に入っていた町丁目が、別々の分類に分かれるようになったりする。

町丁目別人口密度

Page 9: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

2 主題図 トリ ク2.主題図のトリック

》自然分類

2 主題図 トリ ク2.主題図のトリック

》標準偏差

2 主題図 トリ ク2.主題図のトリック

》等間隔

2 主題図 トリ ク2.主題図のトリック

》等量

Page 10: 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性

2 主題図 トリ ク2.主題図のトリック

》手動で切りのいい数字に

▷他人に見せるときは、見る人のことを考えると、▷他人 見 る きは、見る人 を考える 、切りのいい数字で「1,000以上」「 10,000以上」の方が分かりやすい。

3 最適値(最適地)を探す3.最適値(最適地)を探すボロノイ分割(ティーセン分割)

》 垂直二等分線を繋ぎ合せて最近隣領域を分割

も と学びた 人はもっと学びたい人は…

》空間モデリング(奇数年の春学期)

その前に ふつうの統計を学びたい人はその前に、ふつうの統計を学びたい人は…

》データ分析(春学期3クラス・秋学期2クラス)

》 SFCデータ分析教育グループ編『データ分析入》 SFCデ タ分析教育グル プ編『デ タ分析入門』第7版、慶應義塾大学出版会、2008年

》鳥居泰彦『はじめての統計学』日本経済新聞社》鳥居泰彦『はじめての統計学』日本経済新聞社、1994年