ЗАО «Эвентос» Заявка на грант
ЗАО «Эвентос»
Заявка на грант
Решаемая проблема
Экспоненциальный рост неструктурированной информации делает если не невозможным ее
ручной анализ, то очень дорогим.
Решаемая проблема
Ручной анализ информации публикуемой в СМИ и социальных медиа может потребовать
существенных трудозатрат и поэтому часто неэффективен!
Задачи информационного анализа
• При анализе информации необходимо:– Выполнять ее классификацию– Выделять информационные объекты– Объединять отдельные сообщения в группы в
зависимости от их контекста– Иметь возможность быстро найти все документы
определенной тематики и посмотреть ретроспективу развития события во времени
– Сделать предположение о возможном дальнейшем развитии определенной ситуации
Рынок
• Рынок мониторинга социальных медиа• PR агентства и департаменты компаний• Безопасность • Online реклама• Наука и исследования• Электронный документооборот• News & Media
Обзор рынка и прогнозы спроса
Worldwide Business Analytics Software 2014–2018 Forecast and 2013 Vendor Shares
Конкуренты
Лидеры:• В мире:
– AlchemyAPI (IBM)– OpenCalais (Reuters)– Expert System
Semantic intelligence– GATE– NetBase Solutions, Inc.– Google
• В России:– ABBYY– RCO fact extractor
Остальные• NETagger • Saplo (стартап)• OpenNLP• Stanford CoreNLP
Ключевая технология – Машинное обучение
Одна технология позволит решать все представленные ниже задачи
Новый подход к решению задач анализа
данных
Наши преимущества
• Настройка новых предметных областей без лингвистов и программистов
• Высокое качество выделения объектов и скорость обработки
• Удобные, интеллектуальные механизмы для формирования корпуса обучения нейронных сетей
• Мультиязычность• Возможности до-обучения и настройки на новые
предметные области
Бизнес-модель
• SaaS• Продажа лицензий для организаций с
конфиденциальной информацией• Сдача в аренду ПО – Amazon EC2 (Amazon
Machine Image), Microsoft Azure • Партнерская программа для создания и
распространения решений для отдельных предметных областей
Маркетинг и продажи: как будете выходить на рынок
1. Создание SaaS решения с бесплатно-ограниченным доступом
2. Предоставление доступа к системе по подписке
3. Предоставление возможности пользователям скачать и воспользоваться самостоятельно, на своем оборудовании сформированными программными модулями
4. Интеграция всех видов решения в единый программный комплекс с общим интерфейсом
– Настройка и выделение пользовательских объектов– Классификация и кластеризация (определение контекста
текстов) текстов– Хранение, анализ и публикация данных в открытых
форматах (RDF СУБД)
Что уже есть и что будет
• Уже сделано
1. Разработан прототип и первая версия комплекса сбора и определения контекста документов (классификация и кластеризация)
2. Разработана технология выделения любых объектов с использованием машинного обучения
3. Разработан прототип системы обучения новых предметных областей (98% точности при выделении объекта типа Персона)
• Ближайшие планы
1. Создание многопользовательской платформы проектирования и обучения новых предметных областей
2. Внедрение решения выделения фактов («Иванов» работает в ООО «Ромашка»)
3. Создание SaaS решения для контекстного анализа и классификации текстовых документов
Наша Команда
Команда из 30+ высококвалифицированных специалистов – руководителей проектов, лингвистов и программистов
Текущий статус (что сделано), план-график (что и когда планируется
• Имеется:– Разработана базовая технология– Имеется действующий прототип системы
• Планируется (1 очередь)– Разработка SaaS решения
• Web интерфейсы для настройки и обучения систем
• Наличие необходимых API сервисов загрузки и анализа данных
• Механизмы автоматического масштабирования нагрузки
Потребности в капиталовложениях
• Дополнительное финансирование необходимо для:– Создание портала формирования создания размеченных
корпусов для обучения лингвистических процессоров для различных доменов.
– Создание хранилища для обработки корпусов текстов для новых доменов (древнерусские тексты, научная литература и т.д.)
– Создание системы распределенной обработки больших объемов текстов для разных доменов
– Подключение системы оплаты SaaS сервиса– Разработка механизмов распознавания и учета при анализе
полисемии (многозначность смыслов слов)– Создание решения классификации и кластеризации текстов
в виде SaaS продукта
Спасибо за внимание!
ЗАО «Эвентос»пр. Вернадского, 84 корп. 2
119606, Москва, Россия
Тел: +7 (499) 956 09 45
Факс:+7 (499) 956 07 49