Искусственный интеллект и человеческий потенциал целесообразно объединять в платформенные решения

5 июня 2023 г.

Подход максимально эффективен для обучения нейросетей, обработки данных и проектирования цифровых двойников.

 

За чистотой обучения ИИ должны следить люди. Это особенно актуально для экспертных и рекомендательных систем на базе нейросетей, которые внедряют для поддержки принятия управленческих решений. Во всем мире данные для эффективного обучения ИИ размечают с помощью краудсорсинговых платформ, в России также есть свои импортонезависимые решения. Об этом генеральный директор ИТ-компании «Биорг», резидента «Сколково», Руслан Алигаджиев рассказал на российско-белорусской сессии «Совместные решения для промышленности в условиях импортозамещения», которую организовало Минцифры РФ на ЦИПР 2023.

 

По словам гендиректора «Биорг», несмотря на значительный прогресс в сфере ИИ для распознавания, на практике видно, что чистые технологии плохо справляются со сложными и слабоструктурированными данными. Систему нужно постоянно дообучать для распознавания, например, рукописных форм, чертежей. С этой целью работу ИИ контролирует человек.

 

«Такой верификатор в чем-то похож на оператора БПЛА. Он управляет тем, что делает система, и не допускает критических ошибок. Обучение ИИ с участием людей — самое качественное. Для таких задач используют большие крауд-платформы — например, Amazon Mechanical Turk. В России тоже есть свои решения. В их числе и наша платформа, которая настроена на обработку сложных данных и персональных данных. Чем больше обучается ИИ, тем меньше нужно человеческого участия в процессе. Например, у нас на платформе количество операторов снизилось с 50 тыс. до 10 тыс. за период с 2018 по 2022 год. Но есть проекты, где без людей не обойтись», — отмечает Руслан Алигаджиев.

 

Недавно компания загрузила 7 терабайт оцифрованных технических документов в обновленную систему АСУТД Росэнергоатома. С 2018 по 2020 год перевела в электронный вид почти 50 млн актов гражданского состояния органов ЗАГС — на базе в том числе этой информации правительство развивает социальные сервисы. Во всех проектах задействована методика двухэтапного распознавания: на первом этапе документ обрабатывает нейросеть, а данные, распознанные с низким порогом уверенности, переходят на оператора, который верифицирует значения и одновременно дообучает систему.

 

«На уровне коммерческих компаний такой подход применим для высококачественной оцифровки данных - например для перевода в электронный вид любых бумажных документов. На уровне государственных задач методика актуальна для наполнения реестров ведомственных данных, где есть высокие требования к чистоте и непротиворечивости информации. На базе таких реестров ведомства будут обмениваться данными автоматически, а граждане смогут получать проактивные госуслуги. Например, родился ребенок — автоматически назначили пособия, выдали СНИЛС, поставили на очередь в детский сад; приобрел недвижимость — автоматически получил налоговый вычет», — комментирует применение технологии Руслан Алигаджиев.

 

Спикер отметил, что спрос на подобные гибридные системы подтвержден не только на уровне РФ. Интерес проявляют коллеги из дружественных стран, которые также планируют масштабные проекты по оцифровке данных. В этом смысле значительным подспорьем для отечественного технологического бизнеса стала служба Цифровых атташе, инициированная Минцифры и развиваемая Минпромторгом РФ.

 

Ранее на ЦИПР 2023 премьер-министр России Михаил Мишустин поставил задачу активнее экспортировать отечественные разработки.

 

«Многие отечественные разработки могут успешно применяться не только внутри страны. Они, без сомнения, будут интересны и нашим партнерам из дружественных стран», — указал председатель правительства, выступая ЦИПР. «Реализация нашего экспортного потенциала — один из приоритетных векторов развития», — подчеркнул глава правительства.

Поисковые теги
Поделиться