Юрий Богомолов "Методы классификации документов в поиске"

Post on 15-Jun-2015

593 Views

Category:

Technology

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

Рассказ о различных методах классификации документов. Ликбез методов машинного обучения, понятие разделимости классов, советы по выбору множества признаков. Разбор практического примера классификации.

Transcript

Я.Субботник, Минск, 2 июня 2012 года

РазработчикЮрий Богомолов

Методы классификации документов в поиске

2

Как описать картошку?

3

Выбор признаковОдин признак Два признака

4

Точность и полнота

5

6

Обучение с учителем

7

Методы обучения

8

Ирисы Фишера

Длина чашелистика

Ширина чашелистика

Длина лепестка

Ширина лепестка

9

Наивный байесовский метод

10

Линейные методы

11

Дерево принятия решения

12

Обучение без учителя

13

Яндекс.Новости

14

Кластеризация

15

Смешанное обучение

16

Конкретный пример

17

Определение страниц вида 404

18

Где взять выборку для обучения?

Для обучающей выборки нам нужно много примеров страниц

Чтобы написать классификатор, надо иметь такой же классификатор

19

Симбиоз классификаторов

20

Производительность

21

22

Школа анализа данных

http://shad.yandex.ru

ys.minsk@yandex.by

Разработчик

bogomolov@yandex-team.ru

@JuraBogomolov

Юрий Богомолов

top related