Резидент «Сколково» российская компания ABBYY выпустила первые продукты для корпоративного поиска и извлечения данных на базе технологии понимания, анализа и перевода текстов ABBYY Compreno. Запуск этих продуктов имеет большое значение для компании: она начала исследования в этой области 19 лет назад, а инвестиции ABBYY в развитие  данного направления превысили 80 миллионов долларов. Отметим, что ABBYY стала одним из первых резидентов «Сколково» с проектом создания технологии понимания смысла текста ABBYY Compreno, и в 2011 году получила грант в размере около 14 миллионов долларов (475 млн рублей). 

Фото предоставлено компанией ABBYY

«Этот год знаковый для компании, ABBYY исполняется 25 лет. До настоящего времени одним из ключевых направлений для нас являлась разработка технологий распознавания текстов (OCR), с помощью которых можно преобразовывать документы в редактируемые форматы и извлекать данные. Именно благодаря распознаванию текстов ABBYY стала известна в мире, достаточно сказать, что программой FineReader пользуются более 20 миллионов людей. Сегодняшний анонс – это новый этап для компании. Мы разрабатываем принципиально новую базовую технологию и начинаем выпускать на ее основе первые решения. ABBYY по-прежнему работает с текстом, но теперь наши технологии способны анализировать его и понимать смысл. Мы предполагаем, что в будущем данное направление может стать одним из ключевых и прибыльных для компании», — рассказал в интервью Sk.ru президент и генеральный директор группы компаний ABBYY Сергей Андреев. 

Сегодня ABBYY объявила о запуске двух решений для корпоративного поиска и извлечения данных на базе технологии понимания, анализа и переводов текстов ABBYY Compreno: ABBYY Intelligent Search и ABBYY Intelligent Tagger. 

Первое решение — ABBYY Intelligent Search — это система интеллектуального поиска по корпоративным ресурсам. Основываясь на понимании смысла текста, она существенно улучшает качество поиска по различным корпоративным хранилищам компании, помогая сотрудникам организаций из различных отраслей быстро находить всю необходимую информацию.

От скорости и качества принимаемых решений напрямую зависит конкурентоспособность бизнеса, отмечает вице-президент Фонда «Сколково», исполнительный директор IT-кластера Игорь Богачев: «В результате проникновения информационных технологий во все сферы бизнеса объем данных растет как минимум на 50% ежегодно. Уникальная технология ABBYY Compreno позволит существенно ускорить поиск релевантной информации, необходимой для анализа ситуаций и для принятия компетентных решений. Также, на мой взгляд, эта технология позволит обычным людям осуществлять поиск информации, в том числе в сети Интернет, с более точным результатом, а значит тратить на поиск необходимой информации меньше времени».    

Спектр задач, для которых может применяться ABBYY Intelligent Search, весьма широк. Например, можно улучшить качество поиска по файловым хранилищам, корпоративным информационным порталам, организованным на базе Microsoft SharePoint и других ECM-систем, по корпоративным базам знаний или сайтам.

«На американском рынке мы, в первую очередь, нацелены на работу с ISV-разработчиками разных решений. В России мы стремимся работать с разработчиками ECM-систем. У них есть приобретенные базы клиентов, которые с помощью наших решений могут узнать о новых возможностях работы с поиском. Но также отмечу, что в России мы планируем поставлять наши решения в качестве конечного продукта крупным коммерческим компаниям и госсектору, которые имеют большие объемы документов», — пояснил Сергей Андреев. 

Схема ABBYY Intelligent Search

По словам Сергея Андреева, стоимость внедрения ABBYY Intelligent Search будет варьироваться в зависимости от конфигурации внедрения, количества документов, существующих серверных мощностей и прочих факторов. 

Второй продукт — ABBYY Intelligent Tagger — анализирует неструктурированную текстовую информацию и автоматически извлекает из нее метаданные документов и различные сущности (даты, персоны и прочее). Эти данные можно использовать для управления документооборотом, улучшения поисковых систем, оптимизации хранения документов (их классификации, своевременного удаления), фильтрации электронной почты, а также выявления конфиденциальных данных и других задач. Речь идет об инструментарии разработчика, который ABBYY планирует поставлять как производителям ECM-систем, так и внедрять в крупных организациях.

Схема ABBYY Intelligent Tagger

Сейчас оба решения поддерживают русский и английский языки. Именно эти два языковых направления являются для компании приоритетными. В работе также находится немецкий язык, но точные сроки его добавления представители ABBYY пока не раскрывают. 

По словам Сергея Андреева, в настоящее время компания нацелена на выпуск решений именно для корпоративного рынка, поскольку ей важно видеть коммерческую перспективу в том, что она делает.  

Сергей Андреев. Фото: abbyy.ru

«ABBYY Compreno — это базовая технология, которая является лингвистической платформой для решения целого спектра задач. Помимо корпоративного поиска, который мы представляем сегодня, нас, прежде всего, интересуют задачи, связанные с анализом данных и выявлением фактов и связей. Одно из применений целого комплекса наших технологий — это задача eDiscovery — процесс поиска информации в документах компаний в рамках юридических разбирательств, аудита и расследований в США и Великобритании. В данном процессе требуется обработка огромных массивов корпоративной информации для дальнейшего поиска и выявления фактов.  В России заказчиками в этих областях могут быть как корпоративный рынок, так и государственный сектор», — пояснил Сергей Андреев. 

Среди других перспективных для компании направлений: классификация документов, выявление полностью и частично дублирующихся документов с указанием различий в их текстах, анализ тональности высказываний. Это также охрана информационного периметра организации с выявлением фактов передачи несанкционированной информации, система прогнозирования и оповещения о наступлении событий, наконец, многоязычный поиск и письменный перевод. Какие-то конкретные сроки по выпуску очередных новых решений ABBYY пока не озвучивает.

Что можно сказать наверняка — ABBYY не планирует выходить на «открытый» рынок поиска, где сейчас работают Google, «Яндекс». «Задача веб-поиска сегодня решена довольно неплохо, и выходить на этот рынок нам не кажется целесообразным. Для нас сегодня гораздо эффективнее с точки зрения бизнеса работать на корпоративном рынке, представляя решения в области корпоративного поиска», — отметил Сергей Андреев.

Вложения в исследования и разработки, связанные с интеллектуальным поиском, оказались довольно серьезными: ежегодно ABBYY вкладывает в проект более 15 миллионов долларов. Эти инвестиции ведутся, как в рамках проекта «Сколково», так и для других разработок на основе Compreno.

«Когда компания создает принципиально новую базовую технологию и выходит с ней на новый рынок, очень остро стоит задача поиска наиболее перспективных из возможных сфер применения. Есть определенный цикл принятия технологий, который занимает время: от разработки до поиска сценариев применения, их маркетирования, обучения рынка и, наконец, массового внедрения. Такой путь мы сейчас проделываем. И путь этот не простой», — рассказал Сергей Андреев. 

При этом он отметил, что в течение трех лет компания надеется сделать данное направление безубыточным. «Есть все основания полагать, что, в частности, корпоративный поиск станет очень перспективным направлением. В мире объем систем, которые связаны с технологиями корпоративного поиска, в 2014 году составит  около 2 млрд долларов. Потенциальный среднегодовой темп роста составляет около 18%, но он может вырасти в разы в случае появления систем поиска нового поколения, подобных нашей», — пояснил Сергей Андреев. 

Также Сергей Андреев отметил, что грант Фонда «Сколково» оказался для проекта Compreno очень своевременным: «Благодаря «Сколково» проект получил очень нужную динамику, существенно расширил первоначальный свой замысел и спектр применения, до задач поиска и анализа текстовой информации. «Сколково» дает перспективу создавать вокруг нашей компании и новой технологии как можно больше проектов, способных использовать ее и развивать свои бизнесы в различных областях. Это очень важно».