Top Banner
BIOS 362 Advances Statistical Inference (Statistical Learning) Matthew S. Shotwell, Ph.D. Data Science Institute Vanderbilt University Nashville, TN, USA January 6, 2020
19

BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Aug 03, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

BIOS 362 Advances Statistical Inference(Statistical Learning)

Matthew S. Shotwell, Ph.D.

Data Science InstituteVanderbilt UniversityNashville, TN, USA

January 6, 2020

Page 2: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

My Bio

I Matthew (Matt) S. Shotwell, Ph.D.

I Assoc. Prof. in Biostatistics

I 9 years at VU/VUMC

I 70% Biomed. Research / 30% Teaching

I R user 10+ years

I Teach “Statistical Learning” (BIOS 8362); 5 years

I Hastie et al. Elements of Statistical Learning

Page 3: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning and Statistics?

Data science is HOT. From glassdoor.com:

Page 4: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning and Statistics?

source: https://towardsdatascience.com/introduction-to-statistics-e9d72d818745

Page 5: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning and Statistics?

source: https://everett.wsu.edu/majorsdegrees/data_analytics/

Page 6: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning and Statistics?

Impact!

Data scientists:

I Can contribute to almost any worthwhile effort

I Can have large-scale impact

I Are the first to “know”

I Provide crucial interpretation

Page 7: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning in R?

Employers are increasingly looking for data scientists andstatisticians with experience using R. From indeed.com:

source: http://blog.revolutionanalytics.com/2017/02/job-trends-for-r-and-python.html

Page 8: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Why study Machine Learning in R?

Employers are increasingly looking for data scientists andstatisticians with experience using R. From indeed.com:

source: http://blog.revolutionanalytics.com/2017/02/job-trends-for-r-and-python.html

Page 9: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Course Overview

I Syllabus:

I http://biostat.mc.vanderbilt.edu/wiki/Main/

CourseBios362

I Prediction vs. Inference

I Principles of Machine Learning

I Regression Modeling Methods

I Supervised Learning

I Unsupervised Learning

I Statistical Inference

Page 10: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Prediction vs. Inference

Generally two types of tasks:

I Prediction: Is this a picture of a cat or a dog?

I Inference: Does greenhouse gas affect global averagetemperature?

Page 11: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Prediction vs. Inference

Generally two types of tasks:

I Prediction: What’s the probability that Dr. Shotwell willsurvive the semester?

I Inference: How does student effort in class affect thehappiness of instructors?

Page 12: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Prediction vs. Inference

Generally two types of tasks:

I Prediction: Predicting an outcome.

I Inference: Making inferences about an unknown structure,mechanism, or relationship: e.g., effect of an exposure on anoutcome.

I Need to ask: What is my primary task?

I Need to ask: Can I do both at the same time?

I Need to ask: What to consider when doingprediction/inference? Principles of prediction/ML.

Page 13: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Machine learning

source: https://www.wordstream.com/blog/ws/2017/07/28/machine-learning-applications

Page 14: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Supervised learning

I Primarily used for prediction (versus inference)

I Have input (‘features’) AND output (‘target’)

I Create a model (‘learner’) using observed inputs and outputs

I Goal is to predict outputs from new inputs

I “Supervised” because both inputs and outputs to guide model

source: https://www.quora.com/What-is-pattern-recognition

Page 15: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Elements of Statistical Learning (2nd Ed.) c©Hastie, Tibshirani & Friedman 2009 Chap 1

lpsa

−1 1 2 3 4

oo oooo ooo ooo ooooo oo o o oo oo ooo o ooo ooo ooo ooo oo ooo oo ooo oo o ooooo oo o oooo ooo o ooo o ooo oooo oooo ooo oo ooo o

ooo

o oo ooo oooo oooo oo ooo ooooo oo ooo o ooo oo ooo ooo ooooo oooo o oo oo oo o oo ooo oo ooo o ooo oo oo ooo oo o oooo oo oo oo ooo o o

40 50 60 70 80

o o oooo ooo oooo oo o ooo oooo o oooooooo oo oo oo oo o ooo oo ooo oooo oo ooo oo oo oooo o oooo ooo oo o ooooo ooo oo oo ooo oo

o oo

oooooo o oooo ooooo ooo oo oo o ooo ooo ooooo ooo oooo oo oo ooo oo oooo oo oo o ooo oo o o oo oo oo oo o oooo ooo o oo ooo oo oooo oo

0.0 0.4 0.8

oooooooooooooooooooooooooooooooooooooo oooooooo ooooooooooooooo oo ooooooo oo oooooo oooo ooo oo oooo oo

oooo

oooooooooooo oo oo o oooo oo ooo oo o ooooo oo oo oooo o ooo ooo ooo o ooo ooooo oo oo o ooo o oo o o o ooo ooo oo oo oo o oooo o o

oo o

6.0 7.0 8.0 9.0

oo oooooooooo oooo ooooo oo ooo ooooooooo o oooo ooo ooo oooo oo oooooo ooo o ooo oooo oooo oooooooooo oooo oooo oo

oooo

01

23

45

oo oooooooooo oooo ooooo oo ooo oo oooooooo oo oo oooo oo oooo oo ooo ooo o oo o ooo o oooo ooo oo o oo ooo oo oo oo o o oo o oo

o oo

−1

12

34

oooo

o

o

oo

o

oo

o

oooo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

oo

o

o

oooo

ooo

o

ooooo

o

o

o

oooooo

ooooooo

o

ooooo

oo

oooo

o

ooo

o

o

oo

o

o

ooo

o

ooo

lcavolo

oo

o

o

o

oo

o

o o

o

oo oo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

oo

o

o

ooo

o

ooo

o

ooo o

o

o

o

o

ooo oo

o

oo

ooooo

o

oo

o oo

oo

ooo o

o

o oo

o

o

oo

o

o

oo o

o

o oo

oo

oo

o

o

oo

o

oo

o

o oo o

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

o o

o o

o

o

o oo

o

o oo

o

oo

ooo

o

o

o

ooo o

oo

oo

ooo

o o

o

oo

ooo

oo

oooo

o

o oo

o

o

o o

o

o

oo o

o

o oo

oooo

o

o

o o

o

oo

o

oooo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

oo

o

o

ooo

o

o oo

o

oo

ooo

o

o

o

oooo

oo

oo

ooo

o o

o

oo

ooo

o o

oooo

o

oo o

o

o

oo

o

o

ooo

o

o oo

oooo

o

o

oo

o

oo

o

oooo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

oo

o

o

oooo

ooo

o

ooooo

o

o

o

oooooo

oo

ooooo

o

oo

o oo

oo

oo oo

o

o oo

o

o

o o

o

o

ooo

o

ooo

oooo

o

o

oo

o

oo

o

oo oo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

o o

o o

o

o

ooo

o

ooo

o

oo

ooo

o

o

o

o ooooo

oo

ooo

oo

o

oo

o oo

o o

oo oo

o

oo o

o

o

o o

o

o

oo o

o

ooo

oo

oo

o

o

oo

o

oo

o

oooo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

o o

o

o

o oo

o

ooo

o

ooo oo

o

o

o

ooo o

oo

oo

ooooo

o

oooo

o

oo

oooo

o

oo o

o

o

o o

o

o

ooo

o

ooo

oo

oo

o

o

oo

o

oo

o

oooo

o

o

oo

o

o

o

o

o

o

o

o

o

o

oo

o

oo

o o

o

o

o oo

o

o oo

o

ooo oo

o

o

o

ooo o

oo

oo

ooo

oo

o

oo

ooo

o o

oo oo

o

oo o

o

o

o o

o

o

oo o

o

o oo

o

o

o

o oooooooo

oo

oo

ooo

oooooo

o

oo

oo

oo

ooo

o

o

o

o

oo

ooo

oo

oo

oo

oo

o

o

o

o

o

o

oo

o

ooooooooo

oo

o

o

o

o

oo

oo

oo

oooooo

o

oo

ooo

ooo

o

o

o

o oo

oooooo

oo

oo

o oo

oo oo o

o

o

oo

oo

oo

ooo

o

o

o

o

oo

oo o

oo

oo

oo

oo

o

o

o

o

o

o

oo

o

oo

oo

o oo

oo

oo

o

o

o

o

o o

oo

oo

oooo

oo

o

oo

oo o

oo

o

lweighto

o

o

o oo

oooooo

o o

oo

ooo

oooo o

o

o

oo

oo

oo

oo o

o

o

o

o

o o

ooo

oo

oo

o o

oo

o

o

o

o

o

o

oo

o

oo

oo

o oo

oo

oo

o

o

o

o

o o

oo

oo

oooo

oo

o

oo

ooo

ooo

o

o

o

oooo oo

oo o

oo

oo

ooo

oo oo o

o

o

o o

oo

oo

ooo

o

o

o

o

oo

ooo

oo

oo

o o

oo

o

o

o

o

o

o

oo

o

oo

oo

o oo

oo

oo

o

o

o

o

oo

oo

oo

o o oo

oo

o

oo

ooo

oo

o

o

o

o

ooooooooo

oo

oo

ooo

oooooo

o

oo

oo

oo

ooo

o

o

o

o

oo

ooo

oo

oo

oo

oo

o

o

o

o

o

o

oo

o

oo

ooooooo

oo

o

o

o

o

oo

oo

oo

oooo

oo

o

oo

ooo

ooo

o

o

o

ooooooooo

oo

oo

o oo

oo oo oo

o

oo

oo

oo

oo o

o

o

o

o

oo

oo o

oo

oo

o o

oo

o

o

o

o

o

o

oo

o

oo

oo

o oo

oo

oo

o

o

o

o

oo

oo

oo

o ooo

oo

o

oo

oo o

oo

o

o

o

o

ooooooooo

oo

oo

ooo

oo oo oo

o

oo

oo

oo

ooo

o

o

o

o

o o

oo o

oo

oo

oo

oo

o

o

o

o

o

o

oo

o

oo

oo

ooo

oo

oo

o

o

o

o

oo

oo

oo

o ooo

oo

o

oo

ooo

ooo

2.5

3.5

4.5

o

o

o

ooooooooo

oo

oo

ooo

oo oo oo

o

oo

oo

oo

ooo

o

o

o

o

o o

ooo

oo

oo

oo

oo

o

o

o

o

o

o

oo

o

oo

oo

o oo

oo

oo

o

o

o

o

oo

oo

oo

o ooo

oo

o

oo

ooo

oo

o

4050

6070

80

o

o

o

oo

o

oo

o

ooooo

o

ooo

o

o

ooooooooooooo

o

oo

o

oo

oo

ooooo

o

o

o

ooooo

o

o

oo

o

o

o

o

oooo

oooo

o

o

o

o

oooo

ooo

o

o

oooooo

o

o

o

o

o

o

oo

o

o

o

oo

o

oo

o

ooo oo

o

oo

o

o

o

o ooo

o ooo o ooo

o

o

o o

o

oo

oo

oo o

oo

o

o

o

oooo

o

o

o

oo

o

o

o

o

ooo

o

oo

oo

o

o

o

o

ooo

o

oo

o

o

o

oo

oo

oo

o

o

o

o

o

o

o o

o

o

o

oo

o

oo

o

o oooo

o

ooo

o

o

oooo

ooooo o oo

o

o

o o

o

oo

oo

ooo

oo

o

o

o

o ooo

o

o

o

o o

o

o

o

o

ooo

o

oo

oo

o

o

o

o

oooo

oo

o

o

o

oo

oo

oo

o

o

o

o

o

o

o o

ageo

o

o

oo

o

oo

o

oo ooo

o

oo

o

o

o

o ooo

ooo ooo oo

o

o

o o

o

oo

oo

oooo

o

o

o

o

oooo

o

o

o

o o

o

o

o

o

ooo

o

oo

oo

o

o

o

o

o ooo

oo

o

o

o

oo

oo

oo

o

o

o

o

o

o

oo

o

o

o

oo

o

oo

o

ooooo

o

ooo

o

o

ooooooooooooo

o

oo

o

oo

oo

ooooo

o

o

o

ooooo

o

o

oo

o

o

o

o

ooo

o

oooo

o

o

o

o

oooo

ooo

o

o

oo

oo

oo

o

o

o

o

o

o

oo

o

o

o

oo

o

oo

o

ooo oo

o

oo

o

o

o

o ooo

oooo o ooo

o

o

oo

o

oo

oo

oo oo

o

o

o

o

ooo o

o

o

o

oo

o

o

o

o

ooo

o

oo

oo

o

o

o

o

o oo

o

oo

o

o

o

oo

oo

oo

o

o

o

o

o

o

o o

o

o

o

oo

o

oo

o

ooo oo

o

oo

o

o

o

o ooo

oooooooo

o

o

o o

o

oo

oo

oo o

oo

o

o

o

o oo o

o

o

o

oo

o

o

o

o

oooo

oo

oo

o

o

o

o

oooo

ooo

o

o

ooo

ooo

o

o

o

o

o

o

oo

o

o

o

oo

o

oo

o

ooo oo

o

oo

o

o

o

o ooo

oooo oooo

o

o

oo

o

oo

oo

ooo

oo

o

o

o

o oo o

o

o

o

oo

o

o

o

o

ooo

o

oo

oo

o

o

o

o

o oo

o

oo

o

o

o

oo

oo

oo

o

o

o

o

o

o

oo

oooo oo

o

o

ooo

o

oooo

o

oo

o

o

o

o

o

o

o

o

o

o

o

ooo

oo

o

o

o

oo

oo

o

o

o

o

oo

o

o

o

ooo

o

o

o

o

o

o

o

o

o

o

o

ooo

o

o

o

o

o

o

o

o

oo

oo

oo

o

oo

o

o

oo

o

o

o

ooo

o

o

oo oo oo

o

o

o oo

o

oooo

o

oo

o

o

o

o

o

o

o

o

o

o

o

oo

o

oo

o

o

o

oo

o o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

ooo

o

o

o

o

o

o

o

o

o o

oo

o o

o

oo

o

o

o o

o

o

o

o oo

o

o

o oo ooo

o

o

oo o

o

oo oo

o

oo

o

o

o

o

o

o

o

o

o

o

o

oo

o

oo

o

o

o

oo

o o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

o o

o o

o

oo

o

o

o o

o

o

o

ooo

o

o

o o oo oo

o

o

o oo

o

o oo o

o

oo

o

o

o

o

o

o

o

o

o

o

o

oo

o

o o

o

o

o

oo

o o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

o o

oo

oo

o

oo

o

o

oo

o

o

o

oo o

o

o lbph

oooooo

o

o

ooo

o

oooo

o

oo

o

o

o

o

o

o

o

o

o

o

o

ooo

oo

o

o

o

oo

oo

o

o

o

o

oo

o

o

o

ooo

o

o

o

o

o

o

o

o

o

o

o

ooo

o

o

o

o

o

o

o

o

oo

oo

oo

o

oo

o

o

oo

o

o

o

ooo

o

o

oooooo

o

o

ooo

o

oo oo

o

oo

o

o

o

o

o

o

o

o

o

o

o

ooo

o o

o

o

o

oo

oo

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

oo

o o

o

oo

o

o

o o

o

o

o

o oo

o

o

oo oooo

o

o

ooo

o

oooo

o

oo

o

o

o

o

o

o

o

o

o

o

o

ooo

oo

o

o

o

oo

oo

o

o

o

o

oo

o

o

o

ooo

o

o

o

o

o

o

o

o

o

o

o

ooo

o

o

o

o

o

o

o

o

oo

oo

oo

o

oo

o

o

oo

o

o

o

ooo

o

o

−1

01

2

oo oooo

o

o

ooo

o

oooo

o

oo

o

o

o

o

o

o

o

o

o

o

o

ooo

oo

o

o

o

oo

oo

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

oo

o o

o

oo

o

o

o o

o

o

o

ooo

o

o

0.0

0.4

0.8

oooo oooooooooooooooooooooooooooooooooo

o

ooooooo

o

oooooooooooooo

o

o

o

oooooo

o

o

oooo

oo

o

ooo

o

oo

o

o

ooo

o

oooooo

oo oo oo ooo ooo ooooo oo o o oo oo ooo o ooo ooo ooo

o

oo oo ooo

o

o ooo oo o ooooo oo

o

o

o

oo ooo o

o

o

o o oo

o o

o

oo o

o

oo

o

o

o oo

o

oo ooo o

o oo ooo oooo oooo oo ooo ooooo oo ooo o ooo oo ooo

o

oo ooooo

o

ooo o oo oo oo o oo o

o

o

o

o ooo o o

o

o

oo oo

oo

o

oo o

o

oo

o

o

o oo

o

o ooo o o

o o oo oo ooo oooo oo o ooo oooo o oooooooo oo oo oo

o

o o ooo oo

o

oo oooo oo ooo oo o

o

o

o

oo o ooo

o

o

oo oo

o o

o

ooo

o

oo

o

o

oo o

o

o oo o oo

oooooo o oooo ooooo ooo oo oo o ooo ooo ooooo ooo

o

ooo oo oo

o

oo oo oooo oo oo o o

o

o

o

o o o oo o

o

o

o oo o

oo

o

o oo

o

o o

o

o

oo o

o

oooo oo

svi

oooooooooooo oo oo o oooo oo ooo oo o ooooo oo oo

o

ooo o ooo

o

oo ooo o ooo ooooo

o

o

o

o o ooo o

o

o

o o o o

oo

o

oo o

o

oo

o

o

o oo

o

o o ooo o

oo oooooooooo oooo ooooo oo ooo ooooooooo o oo

o

o ooo ooo

o

ooo oo oooooo ooo

o

o

o

o oooo o

o

o

o ooo

oo

o

ooo

o

oo

o

o

ooo

o

oooooo

oo oooooooooo oooo ooooo oo ooo oo oooooooo oo

o

o oooo oo

o

ooo oo ooo ooo o oo

o

o

o

o o oooo

o

o

o oo o

oo

o

oo o

o

oo

o

o

o o o

o

o ooo oo

oooo oooooooo

o

o

o

o

o

o

ooo

o

o

o

oooo

o

o

oooooo

o

o

o

o

oo

o

o

o

o

o

o

oooo

o

o

oo

o

oooo

ooo

o

o

o

o

oo

o

o

o

ooo

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

o

oo

o

o

oo oo oo ooo ooo

o

o

o

o

o

o

o o o

o

o

o

o oo

o

o

o

oo oo

oo

o

o

o

o

o o

o

o

o

o

o

o

ooo o

o

o

oo

o

oo oo

oo

o

o

o

o

o

oo

o

o

o

ooo

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

o

oo

o

o

o oo ooo oooo oo

o

o

o

o

o

o

o oo

o

o

o

oooo

o

o

ooo o

oo

o

o

o

o

o o

o

o

o

o

o

o

oo

o o

o

o

o o

o

o oo o

oo

o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

o

oo

o

o

o o oo oo ooo ooo

o

o

o

o

o

o

o oo

o

o

o

oooo

o

o

oo oo

oo

o

o

o

o

o o

o

o

o

o

o

o

oo

oo

o

o

o o

o

o oo o

oo

o

o

o

o

o

oo

o

o

o

ooo

o

o

o

oo

o

o

o

o

o

o

o

o

o

oo

o

o o

o

o

oooooo o oooo o

o

o

o

o

o

o

o oo

o

o

o

ooo

o

o

o

oooo

oo

o

o

o

o

oo

o

o

o

o

o

o

oo

o o

o

o

o o

o

oo o o

oo

o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

o o

o

o

o

o

o

o

o

o

o

o o

o

oo

o

o

oooooooooooo

o

o

o

o

o

o

ooo

o

o

o

oooo

o

o

oooooo

o

o

o

o

oo

o

o

o

o

o

o

oooo

o

o

oo

o

oooo

oo

o

o

o

o

o

oo

o

o

o

ooo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o o

o

oo

o

o

lcp

oo oooooooooo

o

o

o

o

o

o

ooo

o

o

o

oooo

o

o

ooooo

o

o

o

o

o

oo

o

o

o

o

o

o

oo

oo

o

o

oo

o

o ooo

oo

o

o

o

o

o

oo

o

o

o

ooo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o o

o

oo

o

o

−1

01

23

oo oooooooooo

o

o

o

o

o

o

ooo

o

o

o

ooo

o

o

o

oooooo

o

o

o

o

oo

o

o

o

o

o

o

oo

oo

o

o

o o

o

o o oo

oo

o

o

o

o

o

oo

o

o

o

oo

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

o o

o

oo

o

o

6.0

7.0

8.0

9.0

oo

o

o oooooooo

ooo

o

o

oooo

o

o

o

oo

ooo

oooooo

o

o

ooo

o

o

o

ooo

o

o

oo

o

o

ooooo

o

oo

o

o

o

o

o

ooo

o

oooo

o

ooooooooo

o

oo

o

ooo

o

oooooo

oo

o

o oo ooo ooo

ooo

o

o

oo o o

o

o

o

o o

oo o

ooo ooo

o

o

o oo

o

o

o

ooo

o

o

oo

o

o

o o ooo

o

o o

o

o

o

o

o

o oo

o

o ooo

o

ooo oooo oo

o

o o

o

o oo

o

oo ooo o

o o

o

ooo oooo oo

oo o

o

o

oo oo

o

o

o

oo

ooo

o ooo oo

o

o

o oo

o

o

o

ooo

o

o

oo

o

o

o oo oo

o

oo

o

o

o

o

o

ooo

o

ooo o

o

oo ooo oo o o

o

oo

o

o oo

o

o ooo o o

o o

o

o oo ooo ooo

o oo

o

o

oo oo

o

o

o

oo

ooo

ooo oo o

o

o

o oo

o

o

o

o oo

o

o

o o

o

o

o oo oo

o

oo

o

o

o

o

o

o o o

o

oo oo

o

oo o ooooo o

o

o o

o

oo o

o

o oo o oo

oo

o

ooo o oooo o

ooo

o

o

oo oo

o

o

o

oo

o oo

o ooooo

o

o

o oo

o

o

o

o oo

o

o

o o

o

o

ooo oo

o

o o

o

o

o

o

o

o o o

o

oo oo

o

o o oooo ooo

o

oo

o

oo o

o

oooo oo

oo

o

ooooooooo

ooo

o

o

oooo

o

o

o

oo

ooo

oooooo

o

o

o oo

o

o

o

ooo

o

o

oo

o

o

ooooo

o

oo

o

o

o

o

o

ooo

o

o oo o

o

oooo oooo o

o

o o

o

ooo

o

oooooo

oo

o

ooooooooo

oo o

o

o

oooo

o

o

o

oo

oo o

ooooo o

o

o

o oo

o

o

o

ooo

o

o

o o

o

o

o ooo o

o

oo

o

o

o

o

o

o oo

o

o oo o

o

o ooo ooo oo

o

o o

o

o oo

o

o o ooo ogleason

oo

o

ooooooooo

ooo

o

o

oooo

o

o

o

oo

oo o

oooooo

o

o

o oo

o

o

o

o oo

o

o

oo

o

o

ooo oo

o

o o

o

o

o

o

o

o oo

o

o ooo

o

o o oo ooo oo

o

o o

o

o o o

o

o ooo oo

0 1 2 3 4 5

oo

o

o oooooooo

o

ooo

o

oooo

o

o

o

oo

o

o

o

ooooooooo

o

o

o

ooooo

o

o

oo

o

o

o

o

oooo

o

o

o

o

o

o

o

o

o

ooo

o

oo

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

oo

o

o oo ooo ooo

o

ooo

o

oo o o

o

o

o

o o

o

o

o

ooo ooo ooo

o

o

o

oo o

oo

o

o

oo

o

o

o

o

oo

oo

o

o

o

o

o

o

o

o

o

oo o

o

oo

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

2.5 3.5 4.5

o o

o

ooo oooo oo

o

o oo

o

oo oo

o

o

o

oo

o

o

o

o ooo oo ooo

o

o

o

ooo

oo

o

o

oo

o

o

o

o

oo

o o

o

o

o

o

o

o

o

o

o

oo o

o

o o

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

o o

o

o oo ooo ooo

o

oo o

o

oo oo

o

o

o

oo

o

o

o

ooo oo oooo

o

o

o

ooo

oo

o

o

o o

o

o

o

o

oo

oo

o

o

o

o

o

o

o

o

o

ooo

o

oo

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

−1 0 1 2

oo

o

ooo o oooo o

o

ooo

o

oo oo

o

o

o

oo

o

o

o

o ooooo ooo

o

o

o

ooooo

o

o

o o

o

o

o

o

oo

o o

o

o

o

o

o

o

o

o

o

oo o

o

oo

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

oo

o

ooooooooo

o

ooo

o

oooo

o

o

o

oo

o

o

o

ooooooooo

o

o

o

ooooo

o

o

oo

o

o

o

o

oooo

o

o

o

o

o

o

o

o

o

ooo

o

o o

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

−1 0 1 2 3

oo

o

ooooooooo

o

o oo

o

oooo

o

o

o

oo

o

o

o

ooooo oooo

o

o

o

oo ooo

o

o

o o

o

o

o

o

oo

oo

o

o

o

o

o

o

o

o

o

oo o

o

o o

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

oo

o

ooooooooo

o

ooo

o

oooo

o

o

o

oo

o

o

o

oooooo ooo

o

o

o

oo o

oo

o

o

oo

o

o

o

o

oooo

o

o

o

o

o

o

o

o

o

oo o

o

oo

o

o

oo

o

o

oo

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

0 20 60 100

020

6010

0

pgg45

FIGURE 1.1. Scatterplot matrix of the prostate can-cer data. The first row shows the response against eachof the predictors in turn. Two of the predictors, svi

and gleason, are categorical.

Page 16: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Unsupervised learning

I Have only input, no output

I Discover organization or clustering of input

I Prediction or inference task?

source: https://www.leverege.com/blogpost/machine-learning-course-iot

Page 17: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

I Gene expression array

I Rows - tumor samples

I Cols - genes

I Green - overexpressed

I Red - underexpressed

I Similar samples?

I Similar genes?

Elements of Statistical Learning (2nd Ed.) c©Hastie, Tibshirani & Friedman 2009 Chap 1

SID42354SID31984SID301902SIDW128368SID375990SID360097SIDW325120ESTsChr.10SIDW365099SID377133SID381508SIDW308182SID380265SIDW321925ESTsChr.15SIDW362471SIDW417270SIDW298052SID381079SIDW428642TUPLE1TUP1ERLUMENSIDW416621SID43609ESTsSID52979SIDW357197SIDW366311ESTsSMALLNUCSIDW486740ESTsSID297905SID485148SID284853ESTsChr.15SID200394SIDW322806ESTsChr.2SIDW257915SID46536SIDW488221ESTsChr.5SID280066SIDW376394ESTsChr.15SIDW321854WASWiskottHYPOTHETICSIDW376776SIDW205716SID239012SIDW203464HLACLASSISIDW510534SIDW279664SIDW201620SID297117SID377419SID114241ESTsCh31SIDW376928SIDW310141SIDW298203PTPRCSID289414SID127504ESTsChr.3SID305167SID488017SIDW296310ESTsChr.6SID47116MITOCHONDRChrSIDW376586HomosapiensSIDW487261SIDW470459SID167117SIDW31489SID375812DNAPOLYMESID377451ESTsChr.1MYBPROTOSID471915ESTsSIDW469884HumanmRNASIDW377402ESTsSID207172RASGTPASESID325394H.sapiensmRNGNALSID73161SIDW380102SIDW299104

BR

EA

ST

RE

NA

LM

ELA

NO

MA

ME

LAN

OM

AM

CF

7D-r

epro

CO

LON

CO

LON

K56

2B-r

epro

CO

LON

NS

CLC

LEU

KE

MIA

RE

NA

LM

ELA

NO

MA

BR

EA

ST

CN

SC

NS

RE

NA

LM

CF

7A-r

epro

NS

CLC

K56

2A-r

epro

CO

LON

CN

SN

SC

LCN

SC

LCLE

UK

EM

IAC

NS

OV

AR

IAN

BR

EA

ST

LEU

KE

MIA

ME

LAN

OM

AM

ELA

NO

MA

OV

AR

IAN

OV

AR

IAN

NS

CLC

RE

NA

LB

RE

AS

TM

ELA

NO

MA

OV

AR

IAN

OV

AR

IAN

NS

CLC

RE

NA

LB

RE

AS

TM

ELA

NO

MA

LEU

KE

MIA

CO

LON

BR

EA

ST

LEU

KE

MIA

CO

LON

CN

SM

ELA

NO

MA

NS

CLC

PR

OS

TA

TE

NS

CLC

RE

NA

LR

EN

AL

NS

CLC

RE

NA

LLE

UK

EM

IAO

VA

RIA

NP

RO

ST

AT

EC

OLO

NB

RE

AS

TR

EN

AL

UN

KN

OW

N

FIGURE 1.3. DNA microarray data: expression ma-

Page 18: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

Unsupervised learning

I Have only input, no output

I Dimension reduction of imput

source:

https://hackernoon.com/a-laymans-introduction-to-principal-components-2fca55c19fa0

Page 19: BIOS 362 Advances Statistical Inference (Statistical …biostat.mc.vanderbilt.edu/.../Main/CourseBios362/Intro.pdfBIOS 362 Advances Statistical Inference (Statistical Learning) Matthew

(Statistical) Inference

I Populations, samples, sampling biases

I How methods and tools for inference relate to those for ML

I Fundamentals of frequentist statistics

source: https://mahritaharahap.wordpress.com/teaching-areas/inferential-statistics/