8-9 ноября в Москве прошла конференция AI Journey 2019 (AIJ), организованная Cбербанком России. Мероприятие было посвящено технологиям искусственного интеллекта (ИИ), включая секции по направлениям:
— универсальный ИИ (Artificial General Intelligence — AGI),
— компьютерное зрение (computer vision),
— анализ речи (speech analytics & speech techs),
— обработка естественного языка (natural language processing — NLP),
— рекомендательные системы (recommender systems),
— философии и методология ИИ,
— новые методы машинного обучения (AutoML, MetaML).
Форум был разделен на два рабочих дня — научный (Science Day) и деловой (Business Day). И в большей мере включал технические и научные доклады, а также подведение итогов онлайн-соревнования по машинному обучению в сфере AGI.
При этом и официальная, можно сказать, остро политическая подоплека, также имелась. Как и громкий анонс отечественного инфраструктурного решения. (О нем отдельно — суперкомпьютер-рекордсмен Christofari от Сбербанка )
В октябре в России была утверждена «Национальная стратегия по развитию искусственного интеллекта», принятая указом Президента РФ. В консорциум компаний, чьими силами стратегию планируется исполнять, вошли Сбербанк, Яndex, Mail.ru, Газпром-Нефть, МТС и Российский фонд прямых инвестиций (РФПИ).
Об этом в своем выступлении рассказал сам председатель правления Сбербанка Герман Греф. После чего представил собравшимся свое видение ситуации с тематикой ИИ в России и в мире, ловко подведя к анонсу облачного проекта Сбербанка, очевидно призванному стать первым пунктом в выполнении «дорожной карты» нацстратегии.
В целом изложенные идеи можно свести к нескольким пунктам.
1. Принципиальным моментом для развития технологий ИИ видится использование «облаков» — AI и Cloud понимаются как дополняющие друг друга технологии. В то время как развитие облачного подхода в России недостаточно — по оценке Грефа, лишь 4% компаний в стране используют облачную инфраструктуру.
2. Другой трудностью является несоответствие текущих вычислительных мощностей потребностям сферы ИИ: задачи обучения нейросетей требуют огромных вычислительных ресурсов, особенно если запускаются на системах общего применения. Отмечена необходимость вкладываться в разработку специализированных нейроморфных процессоров, а также внедрения квантовых вычислений. (Последнее, в прочем, более отдаленная перспектива, если говорить о коммерческой реализации.)
На сегодня же отмечается рост интереса к интеграции программной и аппаратной части, заточенных под решение типовых задач ИИ. Например, с использованием GPU или тензорных процессоров TPU. В данном направлении Сбербанк сотрудничает с компанией nVidia.
3. Отмечается демократизация сферы AI и снижение порога компетенции для вхождения в эту сферу. На сегодня, по оценке Сбербанка, 65-75% работающих с решениями ИИ, вовсе не профессиональные Data Scientist. Это стало возможным с развитием открытых и бесплатных фреймворков для решения задач в области AI, таких как библиотеки Python — TensorFlow и PyTourch.
Однако и здесь начинаются ограничения. Часть платформ начинает закрываться для свободного доступа. Это подталкивает создавать собственные российские фреймворки.
Как пример, на слайде были упомянуты отечественные решения для задач классификации и регрессии Yandex CatBoost и dmlc XGBoost, а в качестве платформы для NLP было рассказано о набирающем популярность фреймфорке iPavlov от МФТИ.
4. В репозитариях открытого программного кода — ключевого инструмента для разработчиков ПО — возникают негативные для развития комьюнити тренды. Так, крупнейший Git-репозитарий мира — GitHub — был куплен Microsoft. А другой популярный сервис — GitLab в октябре заявил о нежелании работать с разработчиками из России и Китая. Вывод, по мнению руководства Сбера, напрашивается сам собой — нужно развивать свои площадки. (Строго говоря, GitLab заявил о рассмотрении возможности ограничить прием на работу сотрудников из этих стран, а не об ограничениях доступа к своим сервисам пользователей — речь пока идет исключительно о внутренней кадровой политике самой фирмы.)
В итоге была представлена любопытная модель, описывающая уровень проникновения решений ИИ в экономику. По словам Грефа, она применима как для оценки отдельных компаний, так и отраслей и стран в целом. Для России текущая картина вышла отнюдь не бравурная, в сопоставлении с крупнейшими странами. Приводим ее.
Уровень проникновения ИИ в экономику в разных странах мира
Согласно методике, разработанной Сбербанком совместно с правительством, уровень развития ИИ подразделяется на три, в зависимости от набранных скоринговых баллов. Уровень Legacy (до 40 баллов) подразумевает, что ИИ не используется предприятиями или используется бессистемно. (Применительно к стране — слишком мало компаний реально работают с этой сферой.)
Уровень AI Ready (40-150) — уже используются для ключевых процессов, но точечно. Не создаются платформы ИИ, т. н. фабрики данных.
Наконец, высшим уровнем является AI Native (более 150), на котором ИИ используются уже во всех без исключения процессах предприятий, создаются платформы для их реализации, и сами технологии ИИ понимаются как основной двигатель развития процессов.
Как видно на рисунке, на текущий момент только США и Китай вошли в зону AI Ready. Что же до России — ее уровень в 4 раза меньше, чем у Британии, Канады и Германии.
Цель: к 24 году приподняться хотя бы до уровня 29 баллов, то есть чуть выше того, на которым вышеперечисленные страны пребывают сейчас, плюс сократить отставание. В зону же AI Ready планируется войти лишь к 2030 году.
Собственно, первым заходом для выполнения этого плана стал анонс решения от самого Сбербанка — мощнейший в России суперкомпьютер Christofari на базе GPU nVidia. Подается это, очевидно, как решение, призванное ответить на упоминавшиеся вызовы: адаптированное конкретно под глубокое обучение нейросетей мощное аппаратное решение, предоставляемое в формате облачной инфраструктуры, по демократичной цене доступа. Что сделает возможным обсчет своих моделей и для небольших разработчиков.