Суперкомпьютер Сколтеха войдет в десятку самых мощных в РФ

Летом производительность суперкомпьютера Сколковского института науки и технологий планируется увеличить до 1,5 петафлопс. Вице-президент Фонда «Сколково» Николай Суетин и профессор Сколтеха Максим Федоров рассказали Sk.ru, какие новые возможности это откроет для инновационной экосистемы.

Директор Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами данных Максим Федоров весьма сдержан в оценке мощности машины. В Сколтехе сейчас существует несколько гибридных кластеров (GPU/CPU) общей производительностью порядка 100 TF. Это достаточно условная, средняя величина, поскольку в пиковых значениях для отдельных классов задач она может достигать и нескольких сотен TF. «Сейчас практическая производительность стала сильно зависеть от задачи, а также от требуемой точности (двойная, одинарная, половинная)», - говорит он, поясняя, что в зависимости от задачи, точности и алгоритмов практическая мощность одного устройства GPU может варьироваться в несколько десятков раз.

К лету суперкомпьютер Сколтеха войдет в десятку самых мощных в РФ. Фото: Sk.ru

Апгрейд позволит увеличить пиковую производительность суперкомпьютерной инфраструктуры Сколтеха на порядок, и это создаст качественно новые возможности. Если проиллюстрировать эти новые возможности на примере, то исследователи Сколтеха смогут обрабатывать данные видеонаблюдений такого мегаполиса, как Москва. Или, допустим, обрабатывать и генерировать базы данных с десятками миллиардов параметров молекул-кандидатов в лекарственные препараты. При этом, если сейчас мощность суперкомпьютеров Сколтеха позволяет пользоваться его вычислительными возможностями всего нескольким компаниям Фонда, то после апгрейда суперкомпьютерная инфраструктура Сколтеха сможет обеспечивать потребности сотен сколковских резидентов.

«Это экосистемное решение», - подчеркивает профессор Федоров.

Сколтех также участвует в ряде государственных программ, которые требуют больших вычислительных ресурсов, отмечает вице-президент Фонда «Сколково» по науке и образованию Николай Суетин. «Есть огромное количество вопросов, которые нельзя экспериментально проверить, которые можно только отмоделировать, - говорит он. – Моделировать погоду без суперкомпьютера другими способами вообще нельзя. Никому не нужен прогноз погоды на три дня вперед, который считается неделю». Поэтому один из самых крупных суперкомпьютеров в России – в Гидрометцентре.

К числу приоритетных задач, решению которых будет способствовать апгрейд суперкомпьютера Сколтеха, Николай Суетин относит моделирование новых материалов, в том числе, квантовое моделирование. «Взять 3D-принтинг: не существует точных моделей, которые позволяли бы предсказательно описать режим, необходимый для печатания и получения заданных свойств, - поясняет вице-президент Фонда. – Без мощной вычислительной машины не обойтись, если мы хотим получить новые материалы для квантовых вычислений, для суперконденсаторов; разобраться в том, как происходит интеркаляция [встраивание] лития в новый материал для создания новых мощных аккумуляторов энергии».

«Одна из наших задач – развивать инфраструктуру больших данных и суперкомпьютерных вычислений всей экосистемы «Сколково».То есть это экосистемное решение, и оно происходит в тесном взаимодействии с Фондом»

Или такое направление, как биоинформатика. «Если хочешь промоделировать такую относительно простую вещь, как транспорт через клеточную мембрану, – точной математической модели нет. Если говорить о полной модели клетки, она тоже отсутствует в силу недоступности вычислительного ресурса, который мог бы посчитать полностью модель клетки на атомарном уровне.

Для того объема задач, которые сегодня решает Сколтех, производительности суперкомпьютера уже недостаточно. «Как показала практика, едва только появляется суперкомпьютер любого уровня, он в течение двух лет загружается настолько, что к нему выстраивается очередь. Задач всегда больше возможности вычислений», - добавляет Николай Суетин.

По одежке протягивать ножки

Вопрос в том, сможет ли Сколтех содержать одну из самых мощных машин в стране. В 2016 году бразильцы закупили во Франции суперкомпьютер производительностью 1,1 петафлопс. Но едва машина начала работать, ее пришлось остановить: оказалось, что дата-центру просто не по карману оплачивать счета за электричество.

«Действительно, суперкомпьютер - дорогое удовольствие, поэтому надо по одежке протягивать ножки, - констатирует Н. Суетин. - Однако «Сколково» – достаточно хорошо энергоснабженная организация. Энергии вполне хватит для реализации с помощью суперкомпьютера тех практических задач, которые ставит перед собой наш инженерный университет Сколтех».

Вице-президент Фонда «Сколково» Николай Суетин: «Задач всегда больше возможности вычислений». Фото: Sk.ru

Профессор Максим Федоров обращает внимание на два обстоятельства. Во-первых, энергоэффективность суперкомпьютера в 2016-м и в 2018-м годах – это разные вещи. Ну, и во-вторых, предварительные расчеты показывают, что эксплуатация большого суперкомпьютера Сколтеха сможет выйти на безубыточность: «Все наши проекты ориентированы на создание новых технологий, на взаимодействие с индустрией, поэтому уж затраты на электричество мы точно окупим.

Я перешел в Сколтех из Глазго, где был директором вычислительного центра Западной Шотландии. У нас было несколько сотен пользователей, которые за несколько лет получили грантов и контрактов на сумму в двадцать с лишним раз большую, чем изначальные вложения в суперкомпьютерную инфраструктуру. Мы работали в консорциуме с пятью университетами и десятками компаний, и электричество окупали. Думаю, то же самое будет и здесь. Идея заключается в том, что мы активно взаимодействуем с компаниями, как внутри периметра «Сколково» – это наш первый приоритет, - так и за его пределами», - комментирует он.

При этом Максим Федоров не склонен абсолютизировать возможности суперкомпьютера. По его мнению, человечество еще бесконечно далеко от создания машины, которая приблизилась бы по интеллектуальным способностям к мозгу человека. Полуслепой Кеплер смог на основании наблюдений Тихо Браге вывести законы движения планет, которых сам никогда не видел. В этом отношении возможности машины не превышают способностей насекомого, правда, – «очень специализированного насекомого», как выражается профессор.

Такого, например, как стрекоза. «Возможности стрекозы перехватывать других насекомых – впечатляют. До сих пор непонятно, как стрекозам удается достигать такой точности перехвата (более 95 процентов) при небольшом объеме мозга. Эволюция этого вида насекомых привела к созданию уникальной комбинации эффективного зрительного аппарата (большие фасеточные глаза) и специализированного «бортового компьютера» (мозг стрекозы) управляющего полетом стрекозы и предугадывающим движения ее добычи; современные технологии еще далеки от такого совершенства. Вообще насекомые – специалисты, они свои задачи выполняют очень хорошо. Только сейчас мы начинаем понимать механизмы полета насекомых. Посмотрите, насколько мало они тратят энергии на достаточно дальние пролеты! Если бы мы могли достигать такой же энергоэффективности, как у насекомого, у нас давно бы уже летали микродроны в огромном количестве; но пока нам о такой энергоэффективности остается только мечтать. Более того, до самого последнего времени загадкой являлось то, как многим насекомым (например, шмелям) вообще удается отрываться от земли: маленькие крылышки, небольшие мускулы… А все дело в том что у них крылья движутся по весьма нелинейной траектории, которая позволяет увеличить подъемную силу крыла по сравнению с прямым махом почти на порядок. И опять здесь большую роль играет «бортовой компьютер» насекомого, его мозг, который адаптивно рассчитывает требуемую траекторию взмаха крыла с потрясающей быстротой (порядка миллисекунды). Так что нам есть еще чему поучиться у насекомых в плане специализированных вычислений и создания автоматизированных систем управления …»

«Всё — яд, и всё — лекарство»

Мощный суперкомпьютер нужен, чтобы заглянуть туда, куда иначе заглянуть невозможно, утверждает профессор Федоров: «Мы знаем о недрах Земли меньше, чем мы знаем о космосе. А все потому, что (пока?) не существует телескопа, который позволил бы заглянуть внутрь Земли. Нашим «телескопом» является математическое моделирование. То же касается и глубин океанов. Т.е. суперкомпьютер позволяет промоделировать процессы, которые трудно, опасно, невозможно наблюдать экспериментально.

Директор Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами данных Максим Федоров. Фото: Sk.ru

Мы не можем заглянуть в начало развития Вселенной – нет у нас машины времени, мы можем только промоделировать. И то же можно сказать о различных исторических событиях.

Например, когда в Глазго я заведовал суперкомпьютерным центром, мы участвовали в проекте Школы Искусств Глазго по детальной реконструкции известной битвы англичан и шотландцев при Бэннокбёрне 1314 года. Сейчас детальная компьютерная анимация этой битвы, созданная с помощью нашего суперкомпьютера, является частью экспозиции в историческом музее, расположенном неподалеку от места событий. В ходе проекта выяснилось, что решения, которые принимал вождь шотландцев во время сражения, были единственно верными; не получилось найти другой стратегии, которая привела бы к победе, - это к вопросу о мощи человеческого интеллекта.

С помощью суперкомпьютера можно реконструировать исторические события, исторические здания – как они выглядели пятьсот, тысячу лет назад. Можно реконструировать всевозможные тектонические явления».

«Нам предстоит разработать такие алгоритмы, которые позволят по анализу данных с различных датчиков, с различных камер – если мы говорим о сложных производственных системах, - предсказывать, когда же начался «инкубационный период» техники»

Обращаясь к тому, чем непосредственно занимаются исследователи Сколтеха, Максим Федоров называет три направления, в которых применение более мощного суперкомпьютера может дать качественные сдвиги.

Это, прежде всего, нефтегазовая область, в частности решение обратных задач сейсмологии – фактически, разведка полезных ископаемых (здесь как раз уместна аналогия с телескопом, позволяющим заглянуть внутрь Земли).

Новые материалы. Так, в Центре Сколтеха по Электрохимическому Хранению Энергии профессор Артем Оганов с помощью математического моделирования исследует свойства веществ при сверхвысоких давлениях. Эксперимент при таких давлениях очень дорог и небезопасен; нужно иметь уверенность в том, что из этого эксперимента что-то получится. Своей работой профессор Оганов фактически торит тропу для экспериментаторов. В этом же центре [Электрохимического Хранения Энергия] группа под руководством Андрея Жугаевича ведет активные исследования по применению суперкомпьютерных технологий для конструирования новых материалов и устройств для преобразования и хранения энергии.

Фармакология. Биоактивные вещества в силу своей природы обладают токсичностью. «Всё — яд, всё — лекарство; то и другое определяет доза», - сказано Парацельсом. Поиски нового лекарственного препарата могут быть небезопасны. Поэтому очень важно предсказывать токсичность нового соединения еще до того, как оно будет синтезировано. Это исследования, которые ведутся непосредственно в научной группе профессора Максима Федорова. «С помощью комбинации суперкомпьтерных технологий, методов математического моделирования и машинного обучения мы пытаемся предсказывать не только биоактивность, но и токсичность соединения, - говорит он. - Зная это, при синтезировании нового соединения можно использовать другую степень защиты; а также синтезировать не сразу грамм, например, а гораздо меньшую дозу, нанограмм или миллиграмм.

Это только несколько примеров того, как работает принцип: когда эксперимент невозможен, опасен, труден, дорог, - тогда вступает в силу моделирование», - замечает собеседник Sk.ru.

Метод top down

По словам профессора, проекты его Центра можно разделить на два основных класса. Это, во-первых, математическое моделирование на основе «первых принципов» (известных законов и формул), или bottom up. Например, можно использовать численное решение уравнения Шрёдингера, чтобы понять, какие свойства будут у вновь синтезированной молекулы, поскольку квантовая химия основывается на уравнениях квантовой механики. Так работает классическое математическое моделирование, или bottom up, рассказывает Максим Федоров.

«Есть другой подход, top down, - продолжает он. - Когда мы ничего не знаем о процессе, но у нас есть данные. Я часто привожу пример: мы можем ничего не знать о физиологии человека (и даже не знать самого слова «физиология», но, эмпирически наблюдая за его поведением, мы можем узнать, что он спит около 8 часов в сутки, ему требуется определенное количество еды и т.д. Большое количество эмпирических данных позволяет как в прошлом, так и в настоящем, многим людям без специального медицинского образования существовать и развиваться, не зная толком своей физиологии и анатомии. То есть возможно существовать только на эмпирическом знании. Соответственно есть подход «черного ящика» - top down, когда на основе эмпирических данных с помощью методов статистического анализа и машинного обучения мы строим какие-то зависимости, позволяющие нам изучить явление. Эмпирический подход не требует понимания сути явления, но позволяет его эффективно использовать.

Сейчас мы подходим к современному состоянию, когда у нас идет синтез математического моделирования, суперкомпьютерных технологий и методов анализа больших массивов данных. Это происходит потому что в современном мире технологии и сложность задач уже достигли такого масштаба, что использовать явление, не понимая его сути, опасно.

Идея в том, что вначале мы получаем какие-то эмпирические зависимости с помощью методов машинного обучения, а затем с помощью математического моделирования пытаемся понять суть явления. И наоборот: те вещи, которые удалось описать математическим моделированием, можно попытаться гибридизировать с методами анализа больших массивов данных для того чтобы улучшить качество моделирования. В науке для описания такого гибридного подхода используется термин «суррогатное моделирование».

Суррогатное моделирование используется, например, для предсказательного технического обслуживания сложных систем. Если речь идет об описании очень сложного технического устройства, в котором происходят нелинейные процессы, как, например, в турбине, - время, которое на это потребуется на суперкомпьютере, будет измеряться днями, а то и месяцами. И если нужно турбину очень быстро обсчитывать, чтобы понимать, работает ли она в нормальном режиме или близка к критическому, тогда нужна какая-то более быстрая модель – сплав упрощенного математического моделирования и методов анализа большого массива данных с помощью машинного обучения. Это и есть математическая основа современных технологий предсказательного технического обслуживание сложных систем.

Разглядеть признаки аварийных ситуаций

В Сколтехе собралась самая мощная команда в стране по этой проблематике: Александр Бернштейн, Евгений Бурнаев, Дмитрий Яроцкий, Дмитрий Лаконцев и их коллеги. «У нас огромный потенциал в этом направлении, что иллюстрируется целым рядом активных проектов с рядом крупных компаний, российских и зарубежных, - рассказывает проф. Федоров. - Сложность технологий и сложность производств уже такова, что без, как теперь модно говорить, «цифрового двойника», без постоянного анализа большого массива данных не обойтись. Это позволяет разглядеть за нормальным режимом работы системы признаки аварийных ситуаций, чем мы, собственно, и занимаемся. Как говорит наш ректор, академик Александр Кулешов, «когда у вас много параметров, нужно следить не только за отклонениями каждого параметра, но и за корреляциями между ними». Наши алгоритмы позволяют такой анализ многомерных корреляций проводить.

Это как инкубационный период в человеческом организме. Человек нормально себя чувствует, но в его организме уже происходят какие-то изменения, которые потом вызовут болезнь. Разумеется, болезнь началась не в тот момент, когда у человека подскочила температура. И наша задача – разработать такие алгоритмы, которые позволят по анализу данных с различных датчиков, с различных камер – если мы говорим о сложных производственных системах, - предсказывать, когда же начался «инкубационный период» техники.

«Здесь можно использовать те же методы, что мы используем для предсказательного технического обслуживания сложных систем: это предсказательное обслуживание людей, или предсказательная диагностика»

И, кстати, то же самое мы пытаемся делать для медицины. Сколтех является ведущей организацией большого проекта «CoBrain-Аналитика», поддержанного Национальной технологической инициативой: это сбор и анализ медицинских данных по нейро-заболеваниям. Исследователи Сколтеха совместно с целым рядом ведущих вузов, медицинских клиник и научных организаций страны собрали одну из наиболее крупных коллекций медицинских данных, связанных с нейро-заболеваниями. Это трехмерные данные ЯМР плюс другие анализы, от энцефалограммы и кардиограмм до биохимии. Это нужно для того, чтобы понять картину в комплексе. Допустим, заболевание произошло, это видно на ЯМР-томограмме. А что нам показывают другие анализы? Человек – тоже система. Нельзя ли было предсказать развитие заболевание заранее с помощью других исследований? И это не единственный проект такого рода в Сколтехе. Так, группы Александра Берштейна, Евгения Бурнаева и Михаила Гельфанда совместно с клиницистами из ведущих медицинских организаций активно работают над проектом по разработке новых методов машинного обучения для диагностики, предсказания и профилактики развития психических заболеваний.

Второе мнение

По словам Максима Федорова, речь не идет о том, чтобы машина могла, фиксируя какие-то данные, самостоятельно предсказывать начало развития аномальных процессов в мозге. «Это, скорее, второе мнение. В принципе суть работы не в том, чтобы заменить врача, а в том, чтобы создать для него цифрового советчика. Мое мнение: заменить врача в ближайшее время, в том числе, в диагностике, будет невозможно. Все-таки опыт человека, его мышление бесценны. Но цифровой советчик – это подсказка врачу: возможно, что-то идет не так. Однако машина не заменит врача в плане диагностики и тем более – в плане назначения лечения.

Мне кажется, здесь можно использовать те же методы, что мы используем для предсказательного технического обслуживания сложных систем: это предсказательное обслуживание людей, или предсказательная диагностика».

Руководитель Центра называет апгрейд суперкомпьютера Сколтеха «совместной историей», имея в виду взаимодействие университета и Фонда «Сколково»: «Машина закуплена для совместных проектов, чтобы резиденты Технопарка Фонда имели доступ к вычислительным мощностям. Одна из наших задач – развивать инфраструктуру больших данных и суперкомпьютерных вычислений всей экосистемы «Сколково». То есть это экосистемное решение, - настаивает он. - Оно происходит в тесном взаимодействии с Фондом, с его непосредственным участием, включая сотрудничество с Николаем Суетиным».

И это работа на перспективу, или, если можно так выразиться, на вырост. Только в ИТ-кластера «Сколково» 700 с лишним компаний. Большое количество из них так или иначе связано с машинным обучением, искусственным интеллектом, математическим моделированием. Сколтех и Технопарк «Сколково» создают для них инфраструктуру. И это, конечно, не замыкается на собственно ИТ-компании: биомедицинские стартапы, компании, занимающиеся разработкой промышленных технологий, - это также потенциальные пользователи обновленного суперкомпьютера.

Николай Суетин приводит другой пример экосистемного взаимодействия. Известно, что в России для создания суперкомпьютеров используют импортную компонентную базу. «При этом у нас есть достаточно оригинальные решения, которые занимают лидирующие позиции в мире, - говорит вице-президент Фонда «Сколково». - Это, например, так называемое водяное охлаждение.

Большинство существующих машин имеет воздушное охлаждение: в дата-центрах шум стоит жуткий, а КПД использования очень низкое. Около 40% энергии в среднем расходуется на охлаждение. Решение нашего участника, компании РСК-технологии (дочка большой компании РСК): через небольшие трубочки вода подводится к теплоотводу, который непосредственно контачит с процессором. За счет того, что вода прокачивается только вокруг него, ее температура поднимается до 60 градусов, а потом во внешнем контуре охлаждается. Такие компьютеры стоят уже в нескольких местах, в частности, в Гидрометцентре, в Академии наук, Петербуржском политехническом университете. Совершенно бесшумная, достаточно эффективная штука, экономит энергию.

В рейтинге «зеленых» компьютеров наш участник один из первых по этому параметру. Хотя используют продвинутые, но классические процессоры Intel. Это настолько интересная технология, что Intel имеет с ними соглашение о сотрудничестве и продвигает эти решения по всему миру.

В России есть компания, которая занимается развитием собственного процессора. Она использует новый подход, появившийся буквально несколько лет назад, - RISC V.

Есть архитектуры х86, ARM и др., они все проприетарные, т.е. закрытые. Чтобы пользоваться ими, надо покупать лицензию. А это open source: как есть open source в софте, так он появился в железе. RISC V – сообщество, куда выкладываются все решения, связанные с архитектурой микропроцессоров. В «Сколково» есть компания Sintacor, один из первых членов этого консорциума, что получилось не без нашего участия: когда компания Intel хотела вывезти свою лабораторию из Петербурга, часть людей с этим не согласилась, и мы предложили им сделать компанию, которая стала нашим участником и сейчас активно занимается разработкой новых процессоров на архитектуре RISC V».

Качественные изменения

Возвращаясь к суперкомпьютеру Сколтеха, наращивание его производительности приведет к качественным изменениям, уверен профессор Максим Федоров. Прежде всего, это скажется на скорости выполнения проектов.

«Часть проектов будет выполняться быстрее на порядок, особенно те, которые связаны с машинным обучением, - прогнозирует он. - А в машинном обучении сейчас очень многое определяет скорость, например, скорость обработки больших массивов видеоданных и изображений. Совершенно точно мы сможем работать с большим количеством видео. К лету мы также сможем уверенно работать с большим количеством трехмерных данных. Это, например, данные томографии или данные трехмерного моделирования поверхности Земли. Сейчас мы тоже, естественно, работаем с трехмерными данными, но это пока достаточно медленно, и, скажем так, не получается полета. Что касается видеоданных, то, в качестве примера, мы сможем уверенно работать с данными видеонаблюдений со всей Москвы (при условии, что инфраструктура позволит эти данные собирать). Сейчас пока мы чисто технически не можем работать с такими объемами данных.

Если говорить о лекарственных препаратах, мы сможем обрабатывать базы данных с десятками миллиардов записей параметров молекул-кандидатов в лекарства, чего мы сейчас опять-таки быстро делать не можем. То есть будет не один, а несколько качественных скачков.

То же касается количества компаний «Сколково», пользующихся нашими вычислительными возможностями. Сейчас это несколько резидентов Фонда; когда мы введем новые мощности в строй, можно будет говорить о сотнях компаний».

Сколково it интервью Сколтех mainpost исследования ru статья биомед Николай Суетин Математика