Большие данные и как ими управлять: эксперты обсудили перспективы развития Data Fusion

19 апреля 2022 г.

14-15 апреля состоялась вторая конференция Data Fusion, посвященная синергии межотраслевых данных и созданию качественно новых модельных подходов к их объединению. На одной площадке собрались ведущие разработчики в сфере Data Science и Data Fusion, бизнес-заказчики продуктов и сервисов, представители государства, ученые и исследователи.

 

_DSC7299.jpg

Фото: sk.ru.

 

Возможности и границы

Data Fusion — это естественный шаг в развитии Data Science, предполагающий сквозное объединение данных, слияние информации из множества разнородных источников и их анализ с помощью инструментов машинного обучения. Первый день конференции начался с установочной сессии «Ставка на Data Fusion». Эксперты обсудили, как объединение данных развивается в бизнесе и в госсекторе.

 

Среди трендов, которые оказали наибольшее влияние на Data Fusion в России, спикеры выделили постоянное ускорение бизнес-процессов, повышение ценности данных для решения коммерческих задач и раскрытие государством накопленных за многие годы цифр. Участники сессии поделились кейсами применения Data Fusion в бизнесе. Так, первый заместитель по ИТ руководителя инновационного центра «Безопасный транспорт» Александр Абаркин рассказал о том, как применение инструментов Data Fusion позволило создать в Москве новые транспортные сервисы. А Артем Блинов из ГК «Самолет» привел в пример использование модели прогнозирования цены на арматуру, благодаря которой компании удалось на 3% снизить расходы на закупку стали.

 

Обсудили также возможности для регулирования этой сферы. Эксперты пока не могут прийти к единому мнению, должна ли система регулировать себя сама, или государство, несмотря на то что тоже является заинтересованным игроком рынка, должно взять на себя создание правового и этического фреймворка для снижения сопутствующих рисков.

 

Ответственная разработка: этика сбора, хранения и использования данных

Способы эффективного регулирования новой сферы продолжили обсуждать на сессии «Вопросы доверия и этики в ИИ и работе с данными». Исполнительный директор Ассоциации больших данных Алексей Нейман рассказал о принципах, которые позволяют избежать ошибок в работе рекомендательных сервисов. Среди них прозрачность работы (пользователь должен понимать, на основе каких данных формируется dataset), объективность выборки, которую обеспечивает использование чистых промышленных данных, и эффективные механизмы для получения фидбэка от пользователей для внесения корректировок. По словам Алексея, такой подход повышает доверие к современным технологиям.

 

Руководитель группы регуляторной поддержки МТС Елена Сурагина рассказала о методике оценки гуманитарного воздействия технологий искусственного интеллекта и вопросах, которые должен задать себе разработчик. Например, каковы наихудшие сценарии того, как система может повлиять на общество или на конкретного человека, и кто несет ответственность за социальное воздействие продукта.

 

Дмитрий Демидов, руководитель лаборатории инноваций «НОРБИТ», привел примеры решения этических вопросов в корпоративных системах, где используются инструменты Data Fusion. Можно ли анализировать почту сотрудников? Кто должен принимать решения о повышении или увольнении сотрудника: алгоритм или человек? Дмитрий высказал предположение, что границы дозволенного в каждой конкретной компании должны определять сами сотрудники, принимать кадровые решения должен только руководитель, а алгоритм определяет тех сотрудников, на которых по каким-то причинам стоит обратить внимание.

 

_DSC7373.jpg

Фото: sk.ru.

 

С завершающим докладом сессии выступил эксперт Фонда «Сколково» Сергей Морозов. Он рассказал об использовании больших данных в медицинской сфере, приведя в пример алгоритмы, созданные для прогнозирования развития COVID-19. Сергей отметил, что ключевой ошибкой создания таких алгоритмов становится опора на частные мнения в качестве контрольных данных. Но, несмотря на то что ни один из разработанных алгоритмов пока не готов к клиническому применению, эксперт уверен в экономической целесообразности их использования.

 

— Есть очень понятные задачи разделения нормы и патологии, — говорит Сергей Морозов. — Алгоритм, который делит норму и патологию, позволяет отдать 95% нормы врачам базового уровня, а 5% — на изучение экспертам, чтобы быстрее поставить диагноз и сэкономить средства за счет оптимизации ресурсов. Все это действительно нужно.

 

Лучшие в Data Fusion

Первый день конференции завершила церемония награждения победителей спецноминации Фонда «Сколково» Data Fusion Rising Stars. В отборе приняли участие более 50 компаний из разных сфер бизнеса. Награды вручил директор центра инноваций в финансовом секторе Фонда «Сколково» Павел Новиков.

 

_DSC7573.jpg

Фото: sk.ru.

 

Первое место заняла команда ООО «К-Скай», разработавшая платформу прогнозной аналитики и управления рисками на основе искусственного интеллекта Webiomed. Это первая и единственная в России система поддержки принятия врачебных решений, зарегистрированная как медицинское изделие. Решение позволяет повысить выявляемость у пациентов высокого риска или подозрений на заболевания без участия врача до 7 раз и в 10 раз сократить время на обработку врачом медицинских данных пациента при диагностике.

 

На втором месте оказалась компания «ИнтТерра» с ее системой агросопровождения SKYSCOUT. Решение позволяет увеличить урожайность и объем обслуживаемых площадей, а также оптимизировать расход удобрения и средств защиты растений и семян. На третьем месте — разработчики платформы по персонализации коммуникаций на базе больших данных ООО «Фёрст Дата».