Как научить машину «видеть», различать движения и жесты, «узнавать» лица людей? Эту задачу поставили перед собой челябинские ученые-айтишники и добились потрясающих результатов.


 

Созданная ими инновационная технология компьютерного зрения произвела фурор на прошедшем в Челябинске всероссийском IT-форуме «Информационное общество: умный регион». Что можно увидеть «виртуальным глазом»? Об этом — наш разговор с одним из руководителей творческой команды «Тридиви» Дмитрием Морозовым.


Покорить Кремниевую долину!

— Как родилась ваша команда разработчиков?

 


— Наша малая родина — город ракетчиков и высоких технологий Миасс. «Мозговой центр» команды — Андрей Валик, ему помогают Андрей Цыбулевский, Михаил и Кирилл Хайрисламовы, Андрей Бич. Шесть лет назад «Тридиви» «отпочковалась» от другой миасской научно-производственной компании «Папилон», с которой и сейчас поддерживаем тесные связи. Она в свое время создала для МВД компьютерную систему распознавания преступников по отпечаткам пальцев, что помогает раскрывать 100 тысяч преступлений в год. В мире, кроме «Папилона», есть только три компании, разработавшие системы биометрической идентификации в государственных масштабах: американская 3M, японская NEC и французская Safran. К слову, мы для коллег-«папилонцев» провели оптимизацию алгоритмов, и теперь для распознавания преступников «по пальчикам» уже не требуется огромное количество серверов. Но ученые пошли дальше — разработали новую систему опознания по лицам.

Нас уже знают во многих странах, мы открыли филиал в мировой кузнице IT-технологий — Кремниевой долине США.

Нейросеть для криминала

— А возможно ли научить машину вычислить преступника даже в толпе «по лицу»?

— Это уже полностью наша разработка. Поначалу применяли стандартные технологии машинного обучения, такие как Decision Tree — математический метод решения задач, а позже перешли на нейронные сети — своего рода эмулятор работы мозга. Это позволило намного повысить точность следящих алгоритмов.

Добавлю, что на нашу технологию распознавания лиц для дополненной реальности получен патент. Она в чем‑то схожа с популярной игрой Pokemon Go, но розыск преступников, в отличие от покемонов, вполне реален. Надев очки для компьютерного зрения, полицейский сможет вычленить опасного бандита из тысяч лиц: сразу появляется маркер с его данными. Нашим ноу-хау уже заинтересовалась полиция столицы Арабских Эмиратов Дубаи, Турции. Надеюсь, оно найдет применение и в России. Созданный нами алгоритм распознавания лиц, по данным американского института стандартов NIST, входит в первую тройку ведущих поисковых алгоритмов в мире.

В режиме тени

— Но не менее важно, чтобы компьютер «видел» движения, жесты…

— В фильме «Живая сталь» американского режиссера Шона Леви боевой робот «в режиме тени» повторял движения хозяина. Но как добиться этого? Эту амбициозную задачу мы поставили перед собой и за пять лет создали уникальный сенсор VicoVR, не имеющий аналогов в мире. Напомню, что в последние десятилетия ученые пытаются решить проблему компьютерного зрения, и японская компания Sony для повтора на экране движений игрока создала контроллер Move, израильская PrimeSense — «кинект» для видеоприставки xbox one. Но у этих устройств немало минусов, и, пожалуй, главный в том, что они «привязаны к компьютеру».

У нашего беспроводного сенсора такой привязки нет, он «автономен», предназначен для маломощных портативных устройств с выходом в интернет. Причем программное обеспечение «внутри»: данные по Bluetooth направляются в приложение «шлема» компьютерного зрения. Еще одно отличие челябинского сенсора в том, что он совместим с мобильными системами IOS и Android компаний Apple и Samsung, в то время как «кинект» служит только для компьютерной Windows. Наше программное обеспечение также лицензировано партнерами из Китая и Тайваня.

— Но, видимо, такие разработки стоят недешево…

— Это так. Но наш инновационный проект был поддержан «Сколково»: на его разработку выделили грант в 30 млн рублей. Хорошим подспорьем стал и сбор средств по интернету, на народной краудфандинговой площадке Indiegogo: так удалось собрать 88 тысяч долларов. А когда опытные образцы сенсора успешно прошли испытания, мы получили девятимиллионный грант фонда Бортника на организацию серийного производства. Уже выпущено 500 таких сенсоров нового поколения. В числе покупателей есть и такие компании мирового уровня, как «Фейсбук».

К слову, наша модель уже вышла в серию: в апреле 2017 года запущено ее производство в Китае, в городе Шэньчжень. Но в перспективе планируем переместить его в Россию — возможно, в Калининград, где в особой экономической зоне предоставляются таможенные льготы (комплектующие пока приходится везти из КНР).

Вылечит IT-тренинг?

— А какая реальная польза от ваших ноу-хау? К примеру, в медицине…

— Наша технология многое может дать для реабилитации пациентов медучреждений. Уже разработан комплекс упражнений для восстановления мозговой деятельности: человек, надев очки компьютерного зрения, с помощью сенсора управляет положением тела. Этой технологией уже заинтересовались поставщики медоборудования из Израиля, США и Италии.

А в Челябинске с нами сотрудничает компания PlayStand, изготавливающая развивающие интерактивные системы для детских и медицинских учреждений. К примеру, для ее умной песочницы, проект которой представлен в «Сколково», вместо нынешнего «кинекта» будет использоваться наш сенсор трехмерного машинного зрения. Свой сенсор мы предлагаем в качестве учебного пособия для детских технопарков России — например, для сочинского лагеря юных талантов «Сириус».

— Видимо, есть резон охватить и спорт, другие сферы?

— Наши разработчики Ирина Магденко и Антон Бойцов создали уникальную систему автоматической видеосъемки SkiRacer, которая уже нашла применение для записи горнолыжных соревнований. Вдоль трассы ставятся камеры на электронном управлении, которые следят за лыжниками, улавливая их прыжки и пируэты. Эту разработку уже второй год использует компания Pepsi, выступающая спонсором одного из горнолыжных курортов в Румынии, ее возможно использовать и на чемпионате мира по футболу, который пройдет в России в 2018 году.
Кроме того, наши программисты разработали сервис бизнес-аналитики Seemetrix: камера, которая анализирует эффективность рекламных экранов, дает информацию об их поле, возрасте.

Сфера применения технологии компьютерного зрения практически безгранична. Думаю, ее можно будет применить и в сельском хозяйстве — для прогнозирования урожая, в метеорологии — для предсказания погоды, в космической и оборонной промышленности.

Ощути себя роботом!

— А что может дать машинное 3D-зрение в индустрии компьютерных игр?

— Здесь у нашего ноу-хау открываются новые возможности. К примеру, вместе с челябинской творческой командой Point Cloud создали мобильную версию новой игры Voice of steel («Голос стали») — симулятора боев роботов. Надев шлем компьютерного зрения, игрок погружается в фантастическую виртуальную реальность. Иллюзия присутствия почти полная! Геймер управляет движениями робота, может сам создавать его. Партнеры разработали для мультиплатформенной игры приложение, а мы сенсор с трекингом тела — технологией распознавания жестов.

Наш сенсор нашел применение и у молдавских создателей андроид-игры «Стрельба из лука». Пользователь, посылая стрелы во врага, ощущает себя настоящим Робин Гудом, проходит 50 уровней разного уровня сложности.

— А есть ли игры, полностью созданные вашей командой?

— Андроид-игра Moon Bird («Полет птицы») — разработка наших компьютерщиков во главе с Федором Обуховым. Надев «волшебные очки», геймер управляет полетом, машет крыльями, представляя себя огромным механическим орлом. С высоты птичьего полета он любуется лунным пейзажем, собирает «бочки» с кислородом… Эта игра доступна на Google Play, на днях также запущена в московских парках развлечений и уже пользуется большой популярностью. Уверен, она найдет приверженцев и в Челябинске.

И дым Отечества…

— А нет ли у вас желания уехать за границу, где для «айтишников» созданы все условия?

— Вовсе нет! Я считаю, что уральский регион, Миасс в частности, являются оптимальным местом для размещения инновационных предприятий, ориентированных на международный рынок!

Все что нужно — это заинтересовывать молодых работать головой в сфере высоких технологий. Я уверен: для талантливой молодежи у нас есть все шансы добиться творческого взлета, принести реальную пользу нашему региону.

Именно для этого в Челябинске и Миассе мы открыли школу «Тридиви» и технопарк ЭЛIT для обучения детей от 7 лет программированию и робототехнике.

   

Источник: up74.ru