Top Banner
Виталий Волк Отдел лингвистических технологий Компьютерная лингвистика в Яндексе 1
33

Компьютерная лингвистика в Яндексе

Nov 11, 2014

Download

Internet

Yandex

Рассказ о том, чем занимаются в Яндексе лингвисты. Мы обсудим, как лингвистические данные и методы помогают улучшать поиск и другие сервисы, а ещё поговорим о том, при чём здесь машинное обучение, что такое поисковые расширения и как расшифровывается NERQ.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Компьютерная лингвистика в Яндексе

Виталий ВолкОтдел лингвистических технологий

Компьютерная лингвистика

в Яндексе

1

Page 2: Компьютерная лингвистика в Яндексе

Области применения

• Поиск– Лингвистическая информация о запросе– Лингвистическая информация о документе

• Вне поиска

2

Page 3: Компьютерная лингвистика в Яндексе

Лингвистические методы

• Machine Learning• Статистика

• Контекстно-свободные грамматики • Словарные и корпусные данные• Онтологии• Языковые модели

3

Page 4: Компьютерная лингвистика в Яндексе

В Поиске

4

Page 5: Компьютерная лингвистика в Яндексе

5

Page 6: Компьютерная лингвистика в Яндексе

6

Page 7: Компьютерная лингвистика в Яндексе

7

Page 8: Компьютерная лингвистика в Яндексе

8

Page 9: Компьютерная лингвистика в Яндексе

9

Page 10: Компьютерная лингвистика в Яндексе

10

Page 11: Компьютерная лингвистика в Яндексе

11

Page 12: Компьютерная лингвистика в Яндексе

12

Page 13: Компьютерная лингвистика в Яндексе

13

Page 14: Компьютерная лингвистика в Яндексе

14

Page 15: Компьютерная лингвистика в Яндексе

15

Page 16: Компьютерная лингвистика в Яндексе

16

Page 17: Компьютерная лингвистика в Яндексе

17

Page 18: Компьютерная лингвистика в Яндексе

18

Page 19: Компьютерная лингвистика в Яндексе

19

Page 20: Компьютерная лингвистика в Яндексе

20

Page 21: Компьютерная лингвистика в Яндексе

21

Page 22: Компьютерная лингвистика в Яндексе

Исправление опечаток

• Генерация гипотез• Оценка исходного запроса и каждой гипотезы

по языковой модели (language model)• Сравнение разницы вероятностей с

функцией ошибки

22

Page 23: Компьютерная лингвистика в Яндексе

Тезаурусные расширения

23

Page 24: Компьютерная лингвистика в Яндексе

Как заметить расширения?

Page 25: Компьютерная лингвистика в Яндексе

Контекст запроса: когда нельзя расширять

25

Page 26: Компьютерная лингвистика в Яндексе

Персонализируем расширения

26

Page 27: Компьютерная лингвистика в Яндексе

Вне Поиска

Page 28: Компьютерная лингвистика в Яндексе

Яндекс.Перевод

Page 29: Компьютерная лингвистика в Яндексе

Голосовые команды

Едем от «улица Льва Толстого, 16» до «Азбука Вкуса» через «Лукойл»

Page 30: Компьютерная лингвистика в Яндексе

Извлечение фактов в почте

Page 31: Компьютерная лингвистика в Яндексе

Выделение именованных объектов

31

Page 32: Компьютерная лингвистика в Яндексе

Выделение именованных объектов

32

Page 33: Компьютерная лингвистика в Яндексе

Виталий Волк

[email protected]Отдел лингвистических технологий

Спасибо!