Top Banner
Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев • Учебник Бишопа http://research.microsoft.com/en -us/um/people/cmbishop/prml/ • Стэнфордский курс http://videolectures.net/stanfor dcs229f07_machine_learning/
18

Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа us/um/people/cmbishop/prml

Dec 21, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Семинар “Machine Learning”рук. проф.: Е.Л. Столов, В.Д. Соловьев

• Учебник Бишопа http://research.microsoft.com/en-us/um/people/cmbishop/prml/

• Стэнфордский курс http://videolectures.net/stanfordcs229f07_machine_learning/

Page 2: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/
Page 3: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Пример

Page 4: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Линейная аппроксимация

Page 5: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Использование данных Google Labs для исследования

эволюции лексики

В.Д. Соловьев, Э.Ю. Лернер Казанский федеральный университет

Page 6: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

GOOGLE BOOKS & Ngram Viewer

• GOOGLE BOOKS – хорошо известная электронная библиотека, содержащая 15 миллионов книг (12% всех опубликованных в мире книг)

• Для подсчета частоты слов выбрано подмножество из 5 миллионов книг, содержащих 500 миллиардов (!) слов, в том числе, русскоязычная часть – 35 миллиардов слов

• Реализован удобный интерфейс (Ngram Viewer), предоставляющий статистическую информацию в виде графиков

Page 7: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Частотность

• Прагматически мотивированные изменения частотности языковых элементов приводят к эволюции языка (и лексики, и грамматики)

• Межязыковые различия в частотности “являются значимыми с семантической и, в более общем плане, с общекультурной точки зрения” (А. Вежбицкая)

• Трудоемкость изучения частотности

Page 8: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Пример графика: кровь

Page 9: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Преобразование неправильных глаголов английского языка в правильные

Page 10: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Оценки в английском и русском

Page 11: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Эволюция лексики

• Слова рождаются, распространяются и умирают

• Графики отражают характер этих процессов

• Задача 1: построить математические модели эволюционных процессов

• Задача 2: объяснить характер этих процессов

Page 12: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Пример: модель роста численности популяций

Page 13: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Типичный график

Page 14: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Линейный рост частоты

Page 15: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Научные термины

Page 16: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Динамика популярности личностей

Page 17: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Динамика популярности личностей (продолжение)

Page 18: Семинар “Machine Learning” рук. проф.: Е.Л. Столов, В.Д. Соловьев Учебник Бишопа  us/um/people/cmbishop/prml/

Выводы по динамике распространения слов

• Частота входящих в активный оборот слов растет практически строго по линейному закону

• После короткого пребывания на пике частота падает

• Мало плавных кривых, переход от одной прямой к другой осуществляется быстро

• Также по линейному закону растет частота упоминаний людей или понятий, становящихся популярными

• Проблема. Почему это так?