Top Banner
Základy strojového učení DataRestart 2016 Michal Illich
34

Základy strojového učení

Jan 21, 2018

Download

Technology

michalillich
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Základy strojového učení

Základy strojového učení

DataRestart 2016

Michal Illich

Page 2: Základy strojového učení

Michal Illich

Page 3: Základy strojového učení

Obsah

1. Kdo používá strojové učení?

2. Kde ho můžete použít vy

3a. Jaké modely používat?

3b. Dva jednoduché příklady

4. Co s tím děláme my

5. Shrnutí

Page 4: Základy strojového učení

Kdo používá produkty strojového učení?

Page 5: Základy strojového učení

Kde se používá na webu - I

Page 6: Základy strojového učení

Kde se používá na webu - II

Page 7: Základy strojového učení

Kde se používá na webu - III

Page 8: Základy strojového učení

Mimo web

Siri

OCR

Self-driving cars

Page 9: Základy strojového učení

Kde ho můžete použít vy?

Page 10: Základy strojového učení

Ema má e-shop...

Page 11: Základy strojového učení

Skladovost

● Které zboží mám nakoupit na sklad?

● Cíl:– Minimalizace ceny skladovaného zboží

– Při maximalizace prodejů

Page 12: Základy strojového učení

Cenotvorba

● Jakou mám nastavit marži?(u konkrétního výrobku)

● Cíl:– Maximální celkový zisk

(přičemž nižší cena znamená více prodejů, ale s nižší marží...)

Page 13: Základy strojového učení

Parametry zboží

● Mám desítky tisíc produktů v e-shopu, jak k nim doplnit informace (technické specifikace)?

● Cíl:– Informovat zákazníka a umožnit vyhledávání

– Ale minimalizovat náklady na získání informací

Page 14: Základy strojového učení

Doporučování

● Zákazník si koupil X, jaká Y mu nabídnout?

● Cíl:– Prodat více (nebo častěji)

Page 15: Základy strojového učení

Jaké modely se používají?

Page 16: Základy strojového učení

Co je to vlastně model?

Krabička● Má vstupy● Má výstup(y)● a „uvnitř je chytrá“

Page 17: Základy strojového učení

Jak model vznikne?

Učením!

1. Vyberete algoritmus (a jeho parametry)

2. Natrénujete model (na minulých datech)

3. Pak jej používáte (na nových datech)

Page 18: Základy strojového učení

Lineární regrese

1. Každý vstup má přiřazenou váhu

2. Vstupy prostě vynásobím váhou.

A všechno to sečtu.

3. A mám výsledek.

Page 19: Základy strojového učení

Lineární regrese - příklad

Marže = 3

– 0.2 * PočetKonkurentůCoToMajíSkladem

– 0.3 * PočetKonkurentůCoToMajíLevnější

+ 0.8 * JeToNovinka

+ 0.5 * MámSklademPosledníKus

Page 20: Základy strojového učení

Lineární regrese - pokračování

Co udělá strojové učení lépe než člověk?● zanalyzuje obrovská data● určí koeficienty „matematicky optimálně“● vybere ty správné vstupy● může to vše dělat každou noc automaticky

Page 21: Základy strojového učení

Rozhodovací stromy

Page 22: Základy strojového učení

Neuronová síť

Page 23: Základy strojového učení

Neuronová síť

Velmi obecná- využitelná pro mnoho různých problémů- špičkové výsledky zejména pro obraz a zvuk

Nelineární

Deep learning- obrovský trend- viz mj. i moje přednáška

Hodně „magie“- těžká na interpretaci- vyžaduje zkušenosti s nastavením

Page 24: Základy strojového učení

Kde si s ním hrajeme my

Magictable

Brandiozo

Golem

a jeden neveřejný projekt

Page 25: Základy strojového učení

Hledáme chyby...

Page 26: Základy strojového učení

Případně data rovnou dodáme

Robot to udělá- levněji než lidé- rychleji a na větších datech- stejně přesně nebo lépe

Člověk zůstane v roli dohledu/učitele,nedělá už rutinní práci.

Page 27: Základy strojového učení

Příklad, jak strojové učení používáme

Page 28: Základy strojového učení

Jak jej používáme – vysvětlení

1. Ručně navržené algoritmy spárují zdroje Konkrétně parametry z různých zdrojů (e-shopů, webů)

2. Strojové učení umí předpovědět které spárování je správně a které nejspíš chybně. S přesností 97 %

3. Chybná/podezřelá spárování potlačíme Dáme jim nižší váhu v souhrnném reportu

Page 29: Základy strojového učení

Open source nástroje

Neuronové sítě:

theano, keras, tensorflow, cuda-convnet

Další algoritmy:

gbm, libsvm, vowpal wabbit, sofia-kmeans, gensim

Nástroje s GUI:

weka, orange, rapid miner

Cloudové služby (proprietární):

Amazon, Azure, Google, BigML

Page 30: Základy strojového učení

Závěr

Page 31: Základy strojového učení

1/2

Mít data nestačí. Používejte je.kreslit barevné grafy je základ, nikoliv plné využití dat

Page 32: Základy strojového učení

Strojové učení.nechte stroje samotné najít si vztahy v datech

2/2

Page 33: Základy strojového učení

Díky!

[email protected] @michalillich

MagicTable.com(vyplňte svůj mail, máte-li zájem)

Page 34: Základy strojového učení

Appendix

Zdroje obrázků:http://www.edureka.co/blog/decision-trees/