«Наш проект занимается разработкой программного обеспечения по распознаванию фото- и видеообразов. Причем, мы фокусируемся на бизнес-составляющей, то есть мы не про безопасность, это - не задача поймать террориста или обезвредить преступника.


Это задача оптимизировать бизнес-процессы, снизить человеческий фактор в целом, повысить эффективность бизнеса наших заказчиков». Ведущий – Сергей Корзун.

  

    

«Направление, с которого мы начинали, это распознавание автомобильных номеров. Отличие нашей технологии было в том, что она была способна работать внутри камер. Но самый перспективный продукт, где мы дальше всего продвинулись, это распознавание лиц. По состоянию на сегодня мы входим в тройку технологических компаний по распознаванию лиц». В эксклюзивном интервью для JSON.TV генеральный директор VisionLabs Александр Ханин поясняет, что главное применение своему продукту компания нашла на банковском рынке – это распознавание клиентов. «Бывали случаи, когда мошенники брали 150 кредитов в месяц. Российские национальные кредитные бюро по своим подсчетам оценивали убыток больше чем в 150 млрд. рублей в прошлом году из-за таких действий с поддельными документами. Каждый заемщик почти во всех банках фотографируется. Соответственно, если человек пришел повторно, но уже с другими паспортными данными, наша система может сказать, что «мы вас видели, но у вас был другой паспорт». И эту информацию может передать».

 

«Важное отличие нашей разработки в том, что она полностью лишена сторонних зависимостей. Изначально мы брали open source библиотеки с открытым кодом, что-то мастерили, но потом планомерно от них отказались ввиду невысокого качества. Сейчас движок полностью свой, архитектура полностью своя. У нас сейчас оригинальный гибридный алгоритм, аналогов которого мы не видели. Он работает очень быстро. Для понимания, мы можем на обычном тоненьком ноутбуке сравнивать 90 млн. лиц в секунду. Это безумно большая цифра. Но при этом показывать качество, входящее в тройку лучших».

 

«Безусловно, встречи, акселераторы и фонд «Сколково» многое сделали для нашего развития. Но то, что система востребована – это очевидно. Если бы система была никому не нужна, я считаю, что ни встречи, ни гранты, ни PR не помогли бы. Заказчики просто не покупали бы».

 

В полной видеоверсии интервью Александр Ханин раскрывает подробности технологии, оценивает ситуацию на российском и мировых рынках.

 

 

Справка JSON.TV

Персональный профайл

 

Александр Александрович Ханин.

Родился 2 июня 1987-го года в г. Невинномысск Ставропольского края.

В 2011 окончил с красным дипломом МГТУ им. Баумана по специальности «робототехника», там же завершает написание диссертации.

В настоящее время является генеральным директором проекта VisionLabs.

 

Второй вариант названия (для YouTube):

 

Александр Ханин, VisionLabs. Секретный соус для стартапа.

 

«В бесконечных общениях с заказчиками мы нащупали именно ту нишу, где продукт востребован. И мы объяснили, как человек, приобретающий продукт, вернет свои инвестиции. И как он на этом сможет либо экономить, либо зарабатывать. Мне кажется, залог успеха – не в технологии. Технология могла бы быть и немного хуже. Но тот способ, как мы продукт упаковываем и представляем заказчику, с какими партнерами мы объединились, для того чтобы этот продукт было легко внедрить, в этом секретный соус».

 

В полной версии эксклюзивного интервью для JSON.TV Александр Ханин подробно рассказывает об оригинальном алгоритме распознавания лиц, о его применениях и о рынке.

 

 

 

Полный текст расшифровки интервью:

 

JSON.TV: Всех приветствую. Это JSON.TV. Меня зовут Сергей Корзун, я ваш ведущий. Сегодня мы в гостях в компании VisionLabs у генерального директора Александра Ханина. Здравствуйте, Александр!

 

Александр Ханин: Здравствуйте, Сергей!

 

JSON.TV: Рады, что приехали к Вам. Очень полезным и любопытным делом занимаетесь. Надеемся, что расскажете о нем подробнее. Но сначала – два слова о Вас, справочная информация. По отчеству Вас как будут звать лет через 30-40?

 

Александр Ханин: Александрович.

 

JSON.TV: Родились Вы когда?

 

Александр Ханин: Родился 2-го июня 1987-го года.

 

JSON.TV: В городе…?

 

Александр Ханин: В городе Невинномысск Ставропольского края.

 

JSON.TV: Образование получали?

 

Александр Ханин: образование получил в МГТУ им. Баумана, в 2011-м году закончил с красным дипломом. Сейчас завершаю диссертацию там же и на какую-то часть ставки остался преподавателем в университете.

 

JSON.TV: Понятно. С IT-технологиями связаны с высшей школы, с технической бауманской? Либо раньше?

 

Александр Ханин: С IT-технологиями начал знакомиться в Бауманке. До этого, естественно, был компьютер. Но занялся программированием и алгоритмами в Бауманке. Моя специальность – «робототехника». Была очевидная проблема, что роботы все как большие дорогие телеуправляемые игрушки. У них нет глаз, они могут функционировать только по заранее заданному сценарию. И если они попадают в экстремальные условия, начинаются проблемы. Они не могут адекватно оценить, с кем взаимодействуют, какие дальнейшие шаги предпринять, как реагировать на определенные события. Это мне показалось очень интересной проблемой. Поэтому я с третьего курса начал заниматься. Все курсовые проекты были на эту тему.

 

JSON.TV: Как у Гоголя в «Вие» - «поднимите мне веки, чтобы я видел».

 

Александр Ханин: Да.

 

JSON.TV: То есть зрячий робот – то, с чего начинался этот проект?

 

Александр Ханин: Да, зрячие роботы – это та идея, она по-прежнему осталась, и мы хотим дать роботам (а роботы – это очень широкое понятие), «умным» устройствам возможность видеть, понимать окружающий мир и адекватно с ним взаимодействовать. Пока этого нет, но мы к этому идем.

 

JSON.TV: Если в двух словах: вы идете по пути воспроизводства биологической функции зрения с воспроизводством аппарата, который есть у человека? Либо каким-то другим путем?

 

Александр Ханин: Модно говорить про нейронные сети, нейросетевые алгоритмы, подобие головного мозга. На самом деле, совсем необязательно, что мы воспроизводим именно функционал и структуру каких-то органов чувств человека. Понятно, что камера имеет много схожего со структурой глаза. А что касается именно алгоритмов, тех подходов и решений, которые позволяют получать результат, там, как мне кажется, пока что совсем не то, что у человека. Это действительно подход, который может как-то перекликаться с функционированием человеческого мозга, но пока что очень далеко, мозг гораздо сложнее.

 

JSON.TV: Давайте теперь напрямую о Вашем проекте. Как бы Вы охарактеризовали его? Чем он занимается, проект VisionLabs?

 

Александр Ханин: Наш проект занимается разработкой программного обеспечения по распознаванию фото- и видеообразов. Причем мы фокусируемся на бизнес-составляющей, то есть мы не про безопасность, это не задача поймать террориста или обезвредить преступника. Это задача оптимизировать бизнес-процессы, снизить человеческий фактор в целом, повысить эффективность бизнеса наших заказчиков.

 

JSON.TV: В любом случае, сразу скажу, что технология имеет двойное назначение. Вы же распознаете, например, лица или образы? Это можно использовать и как для безопасности, так и для повышения конкурентоспособности какой-то компании.

 

Александр Ханин: Да, на самом деле, очень правильный комментарий, что технология действительно одна. Этот же движок распознавания может использоваться и в аэропорту, метрополитене и так далее. То есть для задач безопасности. Но мы изначально выбрали фокус нашей деятельности на бизнес. Потому что особенность такая: в бизнес-задачах есть огромное количество данных, алгоритмы очень требовательны к данным. То есть их надо обучать, и чем больше данных получаем, тем лучше они работают. Простой пример, чуть забегая вперед: российские розничные банки фотографируют своих заемщиков. И такой огромной базы фотографий, как у банковской инфраструктуры, пожалуй, нет ни у кого. Начав именно с этого направления, мы, с одной стороны, получили гигантский ресурс по оптимизации и совершенствованию алгоритмов, с другой стороны, получили реальных бизнес-заказчиков, где срок возврата инвестиций хорошо просчитывается. Нам очень импонирует то, что наши заказчики могут каждый день в цифрах считать, сколько они сегодня сэкономили, используя нашу технологию. В безопасности это крайне трудно представить.

 

JSON.TV: Давайте о самой технологии распознавания образов: насколько она сложна, концентрируетесь ли вы почти исключительно на лицах либо распознаете что-то еще?

 

Александр Ханин: У нас 3 направления деятельности. Направление, с которого мы начинали на самом стартовом этапе, это распознавание автомобильных номеров. Мы считаем, что задача давно решена. Отличие нашей технологии было в том, что она была способна работать внутри камер, то есть внутри устройств. Если все конкуренты предлагали, например, «купите камеры, провода, компьютер, поставьте операционную систему, и будет счастье», у нас подход был другой – «купите камеру, и она все сделает».

 

JSON.TV: Включая иностранные номера? Сразу спрошу, потому что это проблема в практическом применении.

 

Александр Ханин: Да, сейчас система умеет распознавать и иностранные номера, в том числе арабские номера, номера стран Латинской Америки, СНГ, конечно, российские номера. Но распознавание автомобильных номеров – это, наверное, 1% от нашей деятельности. Самый перспективный продукт, где мы дальше всего продвинулись, это распознавание лиц. По состоянию на сегодня мы входим в тройку технологических компаний по распознаванию лиц. В мире два теста по распознаванию. Один проводит NIST США, второй проводит университет Массачусетса, США – это UMass. Мы участвовали во втором, потому что он более приближен к бизнес-задачам, там фотографии низкого качества, самые разные ракурсы лица, люди улыбаются, смеются, с открытым ртом, говорят по телефону, то есть типичные жизненные ситуации. Второй тест более простой, потому что это так называемые mugshots, снимки преступников в полицейских участках, где все регламентировано, они стоят, фас, профиль. Это не про нас. В жизни мы такого никогда не встречали. Это основной наш продукт, мы нашли отличное применение – это банковская сфера. Только на ней мы не замыкаемся, но основное применение, которое поначалу мы видели, это распознавание клиентов банков. Какие есть задачи? Наш продукт называется VisionLabs Luna, такая ассоциация с Луной. Есть светлая сторона Луны, есть темная сторона Луны. Поначалу банки использовали в основном только для темной стороны, а это борьба с мошенничеством. Есть проблема, когда некоторые ребята берут пачку поддельных паспортов и обходят отделения банков с целью получить кредиты в какой-то округе, в каком-то городе. Ходят как на работу. Бывали случаи, когда мошенники брали 150 кредитов в месяц. Это огромные деньги, банки реально страдают от этого. Российские национальные кредитные бюро по своим подсчетам оценивали убыток больше чем в 150 млрд рублей в прошлом году из-за таких действий с поддельными документами. Что мы делаем: как я сказал, банки фотографируют клиентов. Но фотографии до недавнего времени просто лежали как свалка файлов, прикрепленные к анкетам. Их никто не смотрел. По факту было много фотографий пустых столов, стульев, плакатов, каких-то знаменитостей, бывало, подкладывали фотографии люди. Например, заходил Брэд Питт взять кредит. Мы понимаем, что это мошенничество. Такие случаи надо отсекать. Решается очень просто: мы понимаем, есть ли человек в кадре, видно ли его лицо. Это шаг номер один. Вторая задача – если человек приходил в банк не один раз, то, очевидно, его лицо можно запомнить и узнать, когда он пришел в последующем.

 

JSON.TV: Для этого нужна своя база данных, с которой сличается свежая фотография.

 

Александр Ханин: Да. У банков есть базы данных. Потому что, как я говорил, каждый заемщик почти во всех банках фотографируется. Соответственно, если человек пришел повторно, но уже с другими паспортными данными, наша система может сказать, что «мы вас видели, но у вас был другой паспорт». И эту информацию может передать. Наш заказчик – это не безопасность, у банка нет задачи посадить человека в тюрьму и так далее. Задача – просто сохранить свои деньги. То есть наш основной заказчик – это подозрение рисков, противодействие мошенничеству. То есть люди, которые рассчитывают скоринги, оценивают платежеспособность и шансы вернуть выданные деньги.

 

JSON.TV: Понятно. Давайте о качестве распознавания. Потому что иной раз утром проснешься, в зеркало взглянешь и сам себя не узнаешь. Как же ваша система-то меня узнает тогда?

 

Александр Ханин: Сразу хочу сказать, что некорректно говорить, что у нас качество распознавания 95% или 98%. Если мы говорим о распознавании, то всегда надо рассматривать 2 параметра. Параметр номер один – просто пример из жизни: представьте, что у вас в офисе работают 100 человек. И на входе стоит система, которая должна пропускать вас в офис по лицу без карточки. Если вы приходите, вы сотрудник, вы в базе, но система вас не узнает, это ложный пропуск, нехорошая ситуация. Ложных пропусков должно быть как можно меньше. Бывает ситуация другая. Например, когда приходит злоумышленник, а система его принимает за своего человека и пропускает. Это тоже ложное срабатывание, false positive. Система ложно сработала положительно. И когда строят кривые по анализу качества системы, надо рассматривать какую-то точку, где одна координата – это количество ложных тревог и количество пропусков. По этим параметрам у нас сейчас следующие результаты. При шансе поднять ложную тревогу 0,01 мы достигаем примерно 97% правильных срабатываний. Но это означает, что всего 3% сотрудников попросят еще раз посмотреть в камеру, перефотографироваться. Показатель один из лучших в мире. Мы его достигли благодаря тому, что у нас есть доступ к реальным данным, и мы обучились не в лабораторных условиях, а в реальной жизни на масштабных банковских сетях.

 

JSON.TV: Само программирование и распознавание образов создавалось вами с нуля? Либо вы базировались на тех опытах и достижениях, которые уже были? Покупали, возможно, какие-то лицензии, начальные программы?

 

Александр Ханин: Важное отличие нашей разработки в том, что она полностью лишена сторонних зависимостей. Изначально разрабатывали самостоятельно. Могу честно признаться, что изначально мы брали Open source библиотеки с открытым кодом, что-то мастерили, но потом планомерно от них отказались ввиду невысокого качества. Сейчас движок полностью свой, архитектура полностью своя. Безусловно, мы читаем статьи и труды лучших мировых конференций, мы регулярно, каждый год посещаем ведущие конференции. Мы смотрим на опыт коллег. Но, по факту, у нас сейчас оригинальный гибридный алгоритм, аналогов которого мы не видели. Он работает очень быстро. Для понимания, мы можем на обычном тоненьком ноутбуке сравнивать 90 млн лиц в секунду. Это безумно большая цифра. Но при этом показывать качество, входящее в тройку лучших. Сейчас мы работаем над новым алгоритмом, наши партнеры его тестируют, где качество распознавания уже лучше, система распознает уже лучше, чем это делал бы человек. Качество распознавания человека тоже измерено по тестам, проводили ученые эксперименты, это 97,53.

 

JSON.TV: Это уже силуэт человека, не только лицо?

 

Александр Ханин: Нет, это портрет. То есть когда человеку даются два портрета и надо отвечать на вопрос, это один и тот же человек или разные. Дают порядка 13-ти тыс. пар, человек отвечает, и измеряют результат, как часто ответили правильно.

 

JSON.TV: Александр, Вы сразу оговорились, что безопасностью не занимаетесь, но тогда безопасность, наверняка, занимается вами? Потому что оружие, которое, с одной стороны, может быть защитное, с другой стороны, может быть оружием наблюдения для каких-то злоумышленников. У вас крыша есть, какие-то контакты поддерживаете с силовиками, со спецслужбами? Или как строятся ваши отношения?

 

Александр Ханин: Напрямую мы не взаимодействуем. Например, у нас сейчас есть проект, который, наверное, косвенно связан с безопасностью, где с силовыми структурами взаимодействуют наши партнеры. Это проект по распознаванию болельщиков, то есть лиц, посещающих спортивные мероприятия. Необязательно только футбол. Какая задача? Есть постановление правительства, которое обязывает заниматься идентификацией лиц по видео. Стадионы и проходные оборудованы видеонаблюдением. Те, которые не оборудованы, сейчас проходят этот этап оснащения. Соответственно, какую задачу можно решать? Глобальная цель – чтобы лицо человека, его личность была привязана к билету. Покупая его в кассе, мы знаем, кто купил. И когда человек проходит на стадион, мы тоже знаем, что именно он прошел, а не передал кому-то другому. В дальнейшем еще есть задача: стадионы оборудованы потрясающей оптикой, камерами, которые позволяют с высокой разрешающей способностью наводить на каждое посадочное место. То есть можно даже проверять, на свое ли место сел человек. Эта задача относится к безопасности, потому что там есть и черные списки. Но, с другой стороны, у нее есть и бизнес-заказчики, потому что многие спортивные клубы хотят знать своих постоянных членов и как-то тоже управлять потоками людей.

 

JSON.TV: Хорошо, давайте поговорим собственно о бизнесе. Какая конкурентная среда? Вы же не одиноки на этом рынке? Как бы Вы ее обрисовали?

 

Александр Ханин: На данный момент конкурентная среда очень интересная. Нашими основными конкурентами являются пока что западные движки распознавания. Самая известная, которой пользуются практически все российские разработчики систем распознавания лиц, это система Cognitec. Есть немецкая компания в Дрездене, Cognitec Systems, которая является, наверное, мировым лидером по распознаванию лиц. Но задачи в основном связаны с безопасностью. Есть еще, конечно, японский движок NEC, но он гораздо менее представлен. Есть российские разработчики, с которыми мы тоже сталкиваемся в некоторых проектах. Но нам по результатам всех тестов в прошлом году удалось во всех проектах выйти победителями. Поэтому мы основными конкурентами считаем именно западные движки. И сейчас идет активная смена. Многие наши партнеры, многие участники рынка, которые использовали немецкие технологии, сейчас переключаются на наш движок. Это не потому, что сейчас волна импортозамещения, хотя тоже, как казалось бы, прекрасный повод.

 

Да. Приятно то, что движок действительно сейчас уже превосходит немецкие аналоги. И превосходит уже весьма существенно. Наши партнеры, заменяя ту библиотеку, с которой они работали многие годы до этого, заменяют ее не на сопоставимый или не на более худший, отстающий продукт, а заменяют на лучший. Причем 100% отечественного производства. То есть можно сказать, что для нас это год освобождения от оккупации, потому что многие технологии заимствованы с Запада.

 

JSON.TV: Насколько велик этот рынок в денежном выражении? Можете его примерно оценить? И на какую долю вы рассчитываете?

 

Александр Ханин: В мире этот рынок оценивается в несколько миллиардов долларов. Оценки самые разные, от 2-х миллиардов до 10-ти. Российский рынок – 2-3% от мирового, он в реальности не очень большой, особенно если мы говорим о бизнес-применениях. В реальности российский рынок – это несколько десятков миллионов долларов. По банковскому сектору, по финансовому мы претендуем на долю рынка не менее 30-ти %, то есть доля очень крупная. Но здесь наши оптимистичные прогнозы вполне обоснованы, потому что, во-первых, с большим количеством ключевых банков мы уже провели пилотные проекты, и технология была признана успешной. А также мы сделали очень важный шаг: мы заключили партнерство с системами бизнес-аналитики, которые уже стоят в 97-ми % банков, например, это SAS, известный мировой вендор. А также с «Кредитным бюро». Это организация, которая объединяет данные о заемщиках по всем банкам. Мы установились, грубо говоря, в сердце этой системе, там используется наш движок. И он позволяет предоставлять максимально удобный, простой способ всем банкам подключаться к этой системе и оптимизировать свой бизнес, опознавать повторных клиентов и, конечно, ловить мошенников.

 

JSON.TV: Вы ‑ молодой проект. Когда собираетесь выйти на точку безубыточности хотя бы? Или сейчас вопрос не об этом, а о клиентской базе и об инвестициях в масштабирование?

 

Александр Ханин: По поводу точки безубыточности, мы ее прошли в августе прошлого года, прошлый год мы закрыли с прибылью. И прибыль инвестировали в дальнейшие разработки. То есть сейчас мы живем на свои средства. Мы не привлекали инвестиции, мы проходили акселерацию в Фонде Развития Интернет-Инициатив, это было очень полезно с точки зрения турбо-ускорения бизнеса. Также мы являемся резидентами «Сколково», и «Сколково» дает существенные налоговые льготы, что тоже позволяет быстрее выйти на точку безубыточности.

 

JSON.TV: То есть у вас вообще не было крупных инвестиций со стороны?

 

Александр Ханин: Крупных инвестиций не было, да. Мы изначально были про бизнес, мы изначально развивали проект, грубо говоря, сидя у заказчика. И это не были разработки «в стол». Мы изначально знали, что будет востребовано, поддерживали тесный контакт. И сейчас живем на свои средства и пока что не планируем привлекать инвестиции.

 

JSON.TV: А далее быстрое масштабирование, чтобы конкуренты не опередили, все-таки предполагает, наверное, какие-то необходимые инвестиции? Думаете об этом?

 

Александр Ханин: Думаем об инвестициях при выходе на мировой рынок. У нас уже есть международные продажи. И сейчас общаемся с западными интеграторами, которые тоже заинтересованы в быстрой и перспективной технологии, то есть «не Cognitec-ом единым». Поэтому инвестиции мы рассматриваем, но немного на следующий этап. С развитием бизнеса в рамках России и СНГ мы справляемся самостоятельно без инвестиций.

 

JSON.TV: Наши эксперты сформулировали несколько специализированных вопросов, на которые хотелось бы получить ответы, в том числе о продуктах интеллектуального наблюдения. Насколько они масштабируемы, с каким количеством камер могут работать? Я понимаю из Ваших первых слов, что каждая камера – это и есть отдельная ячейка, отдельный элемент вашего продукта? Либо нет, либо есть какие-то сочетания?

 

Александр Ханин: На самом деле, у нас не получился бы массовый продукт, если бы мы обязывали своих клиентов ставить камеры с нашим софтом и так далее. Камеры, как правило, уже у всех есть. Причем их сотни тысяч. Для понимания: в не самом крупном банке в сети примерно 40 тыс. камер. Это камеры, которые стоят у людей, которые общаются с клиентами. Поэтому масштабируется система очень легко, она может обрабатывать миллионы запросов. Скорость сравнения – несколько десятков миллионов лиц в секунду. Поэтому масштабирование проходит очень легко.

 

JSON.TV: Количество камер не ограничено практически?

 

Александр Ханин: Количество камер ограничено только производительностью центрального сервера. Плюс для ряда случаев у нас есть возможность обрабатывать видеопотоки локально, рядом с камерой. Например, если камера в офисе подключена к компьютеру, мы можем немного отъедать его вычислительных ресурсов, готовя из потока только лучшие снимки, только лучшие кадры, которые надо отправить уже на сравнение в центральный офис. Задача так решается.

 

JSON.TV: То есть обработка видео в реальном времени возможна?

 

Александр Ханин: Обработка видео в реальном времени и производится.

 

JSON.TV: Вот это и есть. Для получения отдельных слайдов?

 

Александр Ханин: Да. Просто в некоторых случаях есть некоторые точки продаж, где в принципе отсутствует компьютер. То есть стоит маленький терминал, калькулятор, к которому подключен монитор, и камера. И там обрабатывать видео просто негде. В таком случае делается снимок, как банки сейчас это делают, и фото отправляется на анализ. Но от отправки до получения ответа проходит всего 2 секунды. У нас система очень оптимизирована, она может выдерживать колоссальные объемы.

 

JSON.TV: Алгоритмы обработки адаптивны либо фиксированные?

 

Александр Ханин: Мы поставляем уже фиксированную систему, готовую. Но мы понимаем, что алгоритмы не стоят на месте, и у нас каждые 2 недели релиз становится все лучше и лучше. Поэтому мы предусматриваем горячую замену алгоритмов на более совершенные. Мы изначально подходили с такой идеей, что система должна быть самообучающейся, то есть адаптироваться к данному клиенту. Но у нас объем данных уже такой огромный и настолько хорошо репрезентативен, что просто уже нет такой задачи ‑ адаптироваться в каждых условиях. И так уже получается качество очень-очень хорошее.

 

JSON.TV: Подключение видеокамер имеет значение? Можно по IP просто взять, воткнуть, чтобы это сразу пошло и заработало? Нет у вас каких-то специальных требований к камерам?

 

Александр Ханин: У нас каких-то предубеждений, ограничений по поводу камер нет. Мы рассчитываем работу на камеры самых разных ценовых категорий. Некоторые банки считают, что если камера дороже, чем 100 рублей, то это дорогая камера. Поэтому можем забирать потоки в самом разном формате: либо как просто последовательность кадров, либо RTSP потоки, то есть по IP, можем работать и с камерами машинного зрения   , и с IP-камерами, и с обычными веб-камерами. Сейчас готовим еще к выходу «мобильный клиент» для мобильных телефонов.

 

JSON.TV: Большая тема ‑ «облачные сервисы». Предусматриваете ли вы развитие обработки видеоданных в облачном сервисе?

 

Александр Ханин: Да, безусловно, предусматриваем. Но, по сути, наши проекты в банках, в «Кредитном бюро» – это такое частное облако. То есть модель полностью аналогичная. Есть центр обработки данных банка, там стоит сервис. А камеры, иными словами, сотрудники банка, имеют возможность получать туда доступ. Они и взаимодействуют по веб-протоколам. То есть это уже реализовано. Просто сейчас мы собираем такой пул клиентов, которым можно было бы предложить облачный сервис.

 

JSON.TV: Как намереваетесь входить в «Интернет вещей»? И вообще, технологические цепочки, безопасность технологических процессов на железных дорогах, сетях электропередач – в эту сторону смотрите?

 

Александр Ханин: Смотрим в сторону «Интернета вещей», потому что очень многие устройства сейчас обладают камерами. И, соответственно, как минимум могут узнавать своих владельцев. То есть уже не фантастика, чтобы телевизор узнавал, кто из членов семьи перед ним, для того чтобы как-то подстраиваться под предпочтения. Что касается безопасности на железных дорогах, мы получали в свое время запросы, но приняли решение фокусироваться на коммерческой части, то есть именно на бизнес-составляющей, не на безопасности.

 

JSON.TV: И связанной с лицами в первую очередь? Либо это не имеет значения? Нарушение какого-то технологического процесса тоже может быть зафиксировано, обработано, и ваши алгоритмы позволяют это? Я пытаюсь понять, вы сейчас фокусируетесь именно на распознавании лиц? Безопасность, не безопасность – не имеет значения.

 

Александр Ханин: Сейчас основной продукт – действительно лица. Если угодно, можно считать технологическим процессом, например, либо обслуживание клиента в какой-нибудь розничной сети, либо обслуживание клиента в банке. Это же тоже технологический процесс? Как оформить документы, в какой последовательности их отсканировать.

 

JSON.TV: Да, естественно.

 

Александр Ханин: Там есть регламент. Проблема в том, что далеко не все люди следуют регламенту. Наша система позволяет на 100% контролировать этот бизнес-процесс, соблюдать регламент. В случае если возникают какие-то нарушения, система просто уведомляет оператора: «Поправьте такие-то действия». И если оператор упорно продолжает, она передает уже сигнал выше.

 

JSON.TV: Понятно. Ваша судьба как проекта, как стартапа – насколько она удачна и счастлива? Встреча с президентом, наверное, тоже каким-то образом повлияла на вашу судьбу? Если бы не было акселераторов, не было бы «Сколково», не было бы этой встречи, смогли бы вы вот так же развиться? Я пытаюсь понять, какая у нас среда для стартапов.

 

Александр Ханин: Безусловно, встречи, акселераторы и фонд «Сколково» многое сделали для нашего развития. Я не берусь оценивать, что бы было, если бы этого всего не произошло, но уверен, что мы тоже вышли бы на самоокупаемость. Может быть, не летом прошлого года, а летом этого года. Но то, что система востребована – это очевидно. Если бы система была никому не нужна, я считаю, что ни встречи, ни гранты, ни PR не помогли бы. Заказчики просто не покупали бы. А система реально приносит выгоду, она окупается за 3 месяца в среднем в банке. То есть очевидно, что она важна. Поэтому отсюда и успех.

 

JSON.TV: Вы создаете сложный интеллектуальный продукт. А есть мнение, что сейчас, что бы ни делал, группа товарищей создаст идеальную операционную систему для всех устройств, мобильных, настольных, каких угодно. Но эта система не пойдет, потому что есть уже а) привычки потребителей и б) есть мощные гранды, которые эти ниши заняли. И просто новое, пускай значительно лучше, чем то, что было старое, пробиться не может. По вашему опыту: может пробиться новый интеллектуальный продукт на насыщенном рынке?

 

Александр Ханин: Продукт, безусловно, может пробиться. Здесь очень важна бизнес-модель. Мне кажется, что если бы мы ходили и говорили, что у нас прекрасная технология распознавания лиц, мы умеем распознавать людей по ключевым точкам на лице, сравнивать геометрические шаблоны, нам бы клиенты жали руку, говорили: «Молодцы, ребята, мы рады за науку».

 

JSON.TV: «Продолжайте в том же духе».

 

Александр Ханин: Да. У нас подход другой. В бесконечных общениях с заказчиками мы нащупали именно ту нишу, где продукт востребован. И мы объяснили, как человек, приобретающий продукт, принимающий решение в целом как банк, вернет свои инвестиции. И как он на этом сможет либо экономить, либо зарабатывать. Мне кажется, залог успеха – не в технологии. Технология могла бы быть и немного хуже. Но тот способ, как мы продукт упаковываем и представляем заказчику, с какими партнерами мы объединились, для того чтобы этот продукт было легко внедрить, в этом секретный соус. Но если бы технология путала каждого второго человека, то ее бы, конечно, через полчаса выключили. Она не была бы полезной. Правильный тезис, что трудно пробиться каким-то новшествам. Да, поначалу мы встречаем такую историю, что люди даже саботируют. Не хотят они соблюдать регламенты, не хотят получать качественные снимки. Да, какой-то барьер есть. Но он все равно проламывается, если технология приносит пользу.

 

JSON.TV: Реальную выгоду.

 

Александр Ханин: Да. То такой вот болезненный период длится недолго. Потом это уже становится общепринятым фактом. И каждый участник рынка тоже хочет себе приобрести такую систему. У нас иногда есть такая ассоциация: как я сказал, у банков нет задачи посадить мошенников в тюрьму, это не их бизнес. Представьте, что у вас есть несколько банков. В каждый приходят злоумышленники. В одном поставили нашу систему, такой волшебный щит. Мошенники не приходят. Если приходят, то их система отвергает. Их же меньше не стало? Они сконцентрировались на оставшихся. Поэтому это цепная реакция. Технология, безусловно, полезная. Мошенников рано или поздно станет меньше. Конечно, это происходит как гонка вооружения: мы делаем какое-то улучшение, они тоже совершают подвиги и инновации. Но рано или поздно это станет нормой: распознавать лица, верифицировать, идентифицировать клиентов.

 

JSON.TV: Хорошо. Чего вам не хватает на данном этапе? Есть в чем-то загвоздка? Главная проблема вашего стартапа, над которой вы работаете?

 

Александр Ханин: Главная проблема – наверное, не хватает данных. То есть данных действительно у нас очень-очень много по современным меркам, но мы знаем, что технологический потолок мы еще не нащупали. То есть еще есть куда расти. Больше 100% качества распознавания мы не переплюнем, но прижаться к 100% и при этом расширить диапазон рабочих условий. Как у нас раньше было? Мы поначалу говорили, что лицо должно быть преимущественно фронтальным, надо смотреть прямо. Сейчас мы уже допускаем повороты лица на очень большие углы, до 30-ти градусов. Поэтому процесс идет. Не хватает данных, хотим больше данных.

 

JSON.TV: Если я войду в банк, и у меня на лице будет фотография Барака Обамы, камера среагирует? Кем она меня воспримет? Или это совсем легкий тест?

 

Александр Ханин: Наши алгоритмы предусматривают такой сценарий. Но трудно представить, что это массовый эффект даст, что все будут ходить с табличками другого человека. Но камеры такое предусматривают, и алгоритмы. И один из этапов – это проверка, а живой ли человек в кадре? У Вас же фотография статическая? Даже если Вы ее мнете, создавая эффект, даже если Вы принесли голову манекена.

 

JSON.TV: Я приду с планшетом, покажу видео тогда.

 

Александр Ханин: Да, хорошая идея. Систему, на самом деле, можно обмануть. Но 99% случаев, когда можно было обмануть систему, мы отсекаем. Тот малый процент остается, но тоже здесь боремся. Кстати, планшет бликует, мы тесты проводили.

 

JSON.TV: Спасибо, буду покупать антибликовое покрытие. Самый последний, традиционный вопрос: Ваши гаджеты, насколько гаджетозависимы и чем пользуетесь в реальной жизни?

 

Александр Ханин: Пользуемся обычными смартфонами, компьютерами, ничего особенного.

 

JSON.TV: То есть к операционным системам пристрастия нет? Эппломаны или сторонники открытого кода, скажем, в мобильных устройствах?

 

Александр Ханин: Каких-то особых пристрастий нет. Даже по нашим технологиям можно судить о наших пристрастиях. Они кроссплатформенные, могут работать на любой операционной системе. Поэтому нам даже по долгу работы приходится и с Linux системами работать, Windows.

 

JSON.TV: Понятно. Спасибо Вам огромное! Напомню, что мы были сегодня в гостях у генерального директора VisionLabs Александра Ханина. Успехов Вам больших!

 

Александр Ханин: Спасибо большое!

 

JSON.TV: Всем счастливо!

   

Источник: json.tv