Георгий Зуев: «Заказчики из банков и финансовых организаций, ретейла и сервисных холдингов развивают цифровые экосистемы внутри компаний»

21 июля 2021 г.

Основатель сервиса потоковой оцифровки Биорг рассказал Sk.ru, как технологии AI становятся частью повседневной жизни крупного бизнеса

 

На встрече с Дмитрием Медведевым в минувшем апреле вы упомянули, что компания Биорг принимала участие в проекте по созданию единого реестра населения для своевременного обеспечения выплаты семьям с детьми во время пандемии. Расскажите подробнее о результатах работы платформы за последнее время и о значимых для ее развития событиях.

  

Мы преуспели в формировании цифровых баз данных разных типов. Органы государственной власти могут использовать их для оказания услуг населению. За период с начала 2020 года по сегодняшний день в компании оцифровали 1,5 млрд полей с рукописными данными и 50 млн печатных документов: акты гражданского состояния (ЗАГС), паспорта, анкеты клиентов. 

 

20200729213136.jpg

Основатель сервиса потоковой оцифровки Биорг Георгий Зуев. Фото из личного архива.

  

Для компании «Теле2» в течение нескольких месяцев на платформе было оцифровано 15 тонн архивной документации за период с 2007 по 2013 год, создана единая электронная база данных с функциональным интерфейсом. Для SBI Банка на базе Биорг создан распознающий «конвейер» для обработки паспортных данных клиентов, оформляющих кредитные продукты. Реализованы технические и организационные меры охраны и защиты персональных данных, соответствующие федеральному законодательству. Закономерным результатом стало увеличение выручки проекта в несколько раз. 

 

Сфера применения AI становится все шире: заказчики из банков и финансовых организаций, ретейла и сервисных холдингов развивают цифровые экосистемы внутри компаний, на смену запросам по оцифровке архивных данных пришла потребность в автоматизации рутинного ввода бухгалтерских документов, трудовых книжек, документов, удостоверяющих личность клиентов. Быстрый и удобный доступ к данным в электронном виде дает весомые преимущества и в работе с потребителями, и в построении внутренних бизнес-процессов. 

  

В июне 2021 года компания второй раз подряд получила приз «Лучший социальный сервис» конкурса «Лучшие социальные проекты России»: в разгар пандемии инновационная компания создала 10 тысяч новых рабочих мест для операторов ввода данных. 

 

Также Биорг вошел в шорт-лист самых перспективных технологических выпускников программы развития Starthub.Moscow Агентства инноваций Москвы. Всего на участие в программе было подано 950 заявок от технологических предпринимателей, 100 из которых прошли обучение при поддержке наставников и лидеров технологического рынка России. Наш стартап вышел с несколькими HR-кейсами по итогам сотрудничества с Центром корпоративных решений (ЦКР) «Шереметьево». Заказчики выбрали Биорг для автоматической оцифровки документов соискателей во время массового подбора персонала: весь объем документов система оцифровала в срок до 20 минут.

 

WhatsApp Image 2021-07-21 at 20.40.50 (1).jpeg 

Изображение: Sk.ru 

    

В конце июня 2020 года компания Биорг получила грант от Фонда «Сколково» на 5 млн рублей. На что были потрачены эти средства? 

На момент начала работ по гранту был реализован прототип системы распознавания данных паспортов, работавший по неполному циклу: сервис автоматически различал 50–60% всех полей паспортов. Причина была в «шумности» изображений документов — некачественных фото, бликах, затемнениях, нетривиальных позициях слов — чуть выше или чуть ниже полей и так далее. Грантовые средства были использованы для доработки системы. Обновленный нейросетевой «конвейер» самостоятельно «видит» в среднем 95%, оставшиеся 5% спорных случаев верифицируют операторы. Итоговое качество обработки документов — выше 99%. Это единственная на рынке технология, которая обеспечивает итоговый результат такого уровня. Заказчики получают в своей цифровой системе готовые данные, не требующие дополнительной проверки и обработки.

В тех случаях, когда документ не распознается ни силами нейросетей, ни силами операторов, его вообще нельзя оцифровать.

Расчетная пропускная способность обновленной платформы составляет 5 млн паспортных полей в сутки, или 360 тысяч паспортных разворотов, — в два раза быстрее, чем в предыдущей версии. Мы говорим «расчетная», поскольку с таким объемным запросом на оцифровку паспортов нам вряд ли придется столкнуться.

Мы предлагаем облачный сервис (SaaS), при котором заказчику не надо покупать лицензий и проводить обучение сотрудников. Фактически наша система тратит всего 2 секунды на обработку разворота паспорта. Такая скорость недостижима ни для существующих решений обработки информации через смартфоны, ни для on-premise-решений. У нас она обеспечена собственным дата-центром и высокопроизводительными видеокартами. 

  

Как вы видите развитие платформы в ближайшем будущем?

На следующем этапе, вне гранта, команда планирует усовершенствовать нейронный движок Биорг, заменив «конвейер» из нейросетей на одну унифицированную нейронную сеть. В перспективе компания также интегрирует со своей системой мобильное приложение для оцифровки отдельных видов документов.

   

Глобальные планы — развитие цифровых сервисов со всеми преимуществами data labeling, чат-ботов и телефонии, платформа staff-шеринга для автоматизации корпоративных бизнес-процессов, а также выход на рынки call-центров и финансовых услуг.

   

Вы упомянули, что Биорг работает с паспортами, а значит — с большим массивом персональных данных. Как реализован контроль информационной безопасности?

Все данные, которые были распознаны и проверены, хранятся в облаке на локализованных в России серверах. Компания получила лицензии ФСТЭК и ФСБ на обработку и хранение информации. Также стартап Биорг заключил с ПАО «СК Росгосстрах» договор страхования ответственности лиц, оказывающих профессиональные услуги, таким образом, застрахована деятельность по созданию баз данных, обработке персональных данных и разработке программного обеспечения.

WhatsApp Image 2021-07-21 at 20.40.50.jpeg 

Изображение: Sk.ru  

   

Как можно охарактеризовать ситуацию на рынке потоковой оцифровки на сегодняшний день?

Очень условно этот рынок можно разделить на четыре сегмента. В первый попадают компании, деятельность которых сфокусирована на хранении документов, во второй — компании, которые предоставляют узкоспециализированные услуги (например, финансовые, а сканирование документов является для них частью процесса), в третий — крупные разработчики ПО для распознания текстов или для индексирования структурированных и условно структурированных документов. Ни один тип организаций из перечисленных выше не оказывает услуг оцифровки под ключ, для них это скорее побочная деятельность.

 

Четвертый сегмент — это поставщики услуг потоковой оцифровки, применение продуктов которых гарантирует качество обработки документов вне зависимости от их вида и объема. Эти компании предлагают одновременно высокое качество, скорость и экономию бюджета. В этой нише компания Биорг чувствует себя уверенно среди других игроков — и начинающих, и опытных.