Top Banner
ПРИМЕНЕНИЕ МЕТОДОВ DEEP LEARNING К ДИАЛОГОВЫМ СИСТЕМАМ = ЧАТ-БОТАМ Михаил Бурцев, к.ф.-м.н., зав. лаб. «Нейронных сетей и глубокого обучения» МФТИ, директор по науке DeepHackLab вставляем мозги
29

Применение методов Deep Learning к диалоговым системам и чат-ботам

Apr 12, 2017

Download

Internet

ChatBotCamp
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Применение методов Deep Learning к диалоговым системам и чат-ботам

ПРИМЕНЕНИЕ МЕТОДОВ DEEP LEARNING К ДИАЛОГОВЫМ СИСТЕМАМ = ЧАТ-БОТАМ

Михаил Бурцев,к.ф.-м.н., зав. лаб.

«Нейронных сетей и глубокого обучения» МФТИ,

директор по науке DeepHackLab

вставляем мозги

Page 2: Применение методов Deep Learning к диалоговым системам и чат-ботам

• Активность нейрона определяется преобразованием взвешенного суммарного воздействия на него

• Воздействия могут быть активирующими(положительные веса) или тормозными (отрицательные веса)

ИСКУССТВЕННЫЙНЕЙРОН

Page 3: Применение методов Deep Learning к диалоговым системам и чат-ботам

• Искусственная нейронная сеть(ИНС) является концептуальной моделью биологической нейронной сети

• Состоит из элементов, влияющих на активность друг друга

• Основные свойства– надежность – по мере ухудшения

качества входа, удалении связей или элементов эффективность сети снижается постепенно

– гибкость – ИНС могут быть применены в широком круге задач

– генерализация – достаточно обучения на ограниченной выборке

– ассоциативность памяти

ИСКУССТВЕННАЯНЕЙРОНАЯ СЕТЬ

Page 4: Применение методов Deep Learning к диалоговым системам и чат-ботам

ЧТО ТАКОЕГЛУБОКОЕ ОБУЧЕНИЕ?

DEEP LEARNING =

DIG DATA + GPU

Page 5: Применение методов Deep Learning к диалоговым системам и чат-ботам
Page 6: Применение методов Deep Learning к диалоговым системам и чат-ботам
Page 7: Применение методов Deep Learning к диалоговым системам и чат-ботам

РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ

задача предсказания временных рядов

архитектура рекуррентной сети

LSTM ячейка

примеры приложений в области работы с текстом

Page 8: Применение методов Deep Learning к диалоговым системам и чат-ботам

• Какое из событий предсказывает появление -

В ПОИСКАХ ПАМЯТИ

.E D C. . .B . XA . . ?????

нейросеть

X

Page 9: Применение методов Deep Learning к диалоговым системам и чат-ботам

• «Классические» нейронные сети – сети прямого распространения (feedforward network) не обладают памятью.

• «Активации» проходят всю сеть насквозь.

• Нейросети «с памятью» –рекуррентные сети.

• За счет наличия обратных связей «активации» циркулируют в сети.

В ПОИСКАХ ПАМЯТИ

сеть прямого распространения

рекуррентная сеть

Page 10: Применение методов Deep Learning к диалоговым системам и чат-ботам

• Сигнал затухает!

П РОБЛЕМА ГЛУБИНЫ

Page 11: Применение методов Deep Learning к диалоговым системам и чат-ботам

• «Однослойная» рекуррентная

сеть

• LSTM

• «Ячейка памяти», управляемая

затворами

LSTM

Page 12: Применение методов Deep Learning к диалоговым системам и чат-ботам

LSTM: Н ЕЙРОАРХИТЕКТУРА

Page 13: Применение методов Deep Learning к диалоговым системам и чат-ботам

Human: what is the purpose of life?Machine: to serve the greater good.Human: what is the purpose of living?Machine: to live forever.Human: what is the purpose of existence?Machine: to find out what happens when we get to the planet earth.Human: where are you now?Machine: i’m in the middle of nowhere.Human: what is the purpose of dying?Machine: to have a life.Human: what is the purpose of being intelligent?Machine: to find out what it is.Human: what is the purpose of emotions?Machine: i don’t know.

Vinyals, O. and Le, Q., 2015. A neural conversational model. arXiv preprint arXiv:1506.05869.

Page 14: Применение методов Deep Learning к диалоговым системам и чат-ботам
Page 15: Применение методов Deep Learning к диалоговым системам и чат-ботам

Алиса теперь счастлива.

• Она не говорит, что это так.

• Она в опасности.

• Она выглядит прекрасно.

• Она была на концерте Фаллуджи.

• Я знаю, что она влюблена в него.

• Она великолепна.

• Она принесла нам немного воды.

• Она ведьма.

• А когда она говорит: "Я не говорю, что когда она позвонит"

• И когда она вернётся, я поняла,

Алиса попала в беду.

• Она не собирается никого убивать.

• Она изменила свою жизнь.

• Да, да. Она не умеет жить.

• Я видела в ней все свои приключения.

• Вот она вот и все.

• Ты не нашел ее?

• И все же так обожает.

• . ♪ К кому она придумала это? ♪

• А она не знает, кто ты?

Page 16: Применение методов Deep Learning к диалоговым системам и чат-ботам

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Внутреннее представление вопроса

Page 17: Применение методов Deep Learning к диалоговым системам и чат-ботам

ПРИ ГЕНЕРАЦИИ ОТВЕТАХРАНИМ В ПАМЯТИ ВОПРОС

Внутреннее представление вопроса

Page 18: Применение методов Deep Learning к диалоговым системам и чат-ботам

Yao, Kaisheng, Geoffrey Zweig, and Baolin Peng. "Attention with Intention for a Neural Network Conversation Model." arXivpreprint arXiv:1510.08565 (2015).

ПРИ ГЕНЕРАЦИИ ОТВЕТАХРАНИМ В ПАМЯТИ ВОПРОС +

СОСТОЯНИЕ ДИАЛОГА

Внутреннее представление вопроса

Внутреннее представление диалога

Page 19: Применение методов Deep Learning к диалоговым системам и чат-ботам

ПОРЯДОК ИМЕЕТ ЗНАЧЕНИЕДВУНАПРАВЛЕННОЕ КОДИРОВАНИЕ

Schuster, Mike, and Kuldip K. Paliwal. "Bidirectional recurrent neural networks." Signal Processing, IEEE Transactions on45.11 (1997): 2673-2681.

Внутреннее представление вопроса

Page 20: Применение методов Deep Learning к диалоговым системам и чат-ботам

ПОРЯДОК ИМЕЕТ ЗНАЧЕНИЕ ФУНКЦИЯ «ВНИМАНИЯ»

«внимание»

Page 21: Применение методов Deep Learning к диалоговым системам и чат-ботам

Weston, Jason, et al. "Towards ai-complete question answering: A set of prerequisite toy tasks." arXiv preprint arXiv:1502.05698 (2015).

Page 22: Применение методов Deep Learning к диалоговым системам и чат-ботам

СЕТЬ С ПАМЯТЬЮMEMORY NETWORK

Sukhbaatar, S., Weston, J., & Fergus, R. (2015). End-to-end memory networks. In Advances in Neural Information Processing Systems (pp. 2431-2439).

Page 23: Применение методов Deep Learning к диалоговым системам и чат-ботам

Sukhbaatar, S., Weston, J., & Fergus, R. (2015). End-to-end memory networks. In Advances in Neural Information Processing Systems (pp. 2431-2439).

СЕТЬ С ПАМЯТЬЮMEMORY NETWORK

Page 24: Применение методов Deep Learning к диалоговым системам и чат-ботам

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

ДИНАМИЧЕСКАЯ СЕТЬ С ПАМЯТЬЮDYNAMIC MEMORY NETWORK

Page 25: Применение методов Deep Learning к диалоговым системам и чат-ботам

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

Page 26: Применение методов Deep Learning к диалоговым системам и чат-ботам

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

Page 27: Применение методов Deep Learning к диалоговым системам и чат-ботам

300 заявок на участие50 участников

12 команд2 команды из Армении1 команда из Эстонии

20 лекций на youtube3000 просмотров на неделю

31.01-06.02.2016 – MIPT

qa.deephack.me

Page 28: Применение методов Deep Learning к диалоговым системам и чат-ботам

ГЛУБОКОЕ ОБУЧЕНИЕЧАТ-БОТЫ

� Рекуррентные нейронные сети для кодирования последовательностей� LSTM

� GRU

� MemNN

� Сохранение в памяти представления о� вопросе

� текущем состоянии диалога в целом

� Учет порядка слов в предложении� двунаправленное кодирование

� функция внимания

Page 29: Применение методов Deep Learning к диалоговым системам и чат-ботам

вставляем мозги

Neural Networks

and Deep Learning

Lab