«Люди не смогут отличить, что реально, а что воображаемо»
Тема искусственного интеллекта в 2023 году вышла на первый план. О работе компаний OpenAI и DeepMind теперь знают даже те, кто в обычной жизни не интересуется нейросетями. А вот кто стоит во главе этих компаний, кто занимается разработкой ИИ и других технологий будущего, известно далеко не каждому. Представляем пять кратких историй большого успеха, достигнутого в том числе и выходцами из России.
Кто создает искусственный интеллект и что они сами думают о влиянии нейросетей на человека
Илья Суцкевер
Илья Суцкевер — сооснователь и главный научный сотрудник OpenAI. Широкую известность получил в ноябре 2023 года после скандала с увольнением из компании Сэма Альтмана — сооснователя и руководителя OpenAI.
Родился в 1984 году в Нижнем Новгороде, детство провел в Израиле, подростком эмигрировал с семьей в Канаду.
Илья начал увлекаться программированием в семь лет. Он получил степень бакалавра в области математики в Университете Торонто, а затем — степень магистра и доктора философии в области компьютерных наук.
В университете Суцкевер познакомился с профессором Джеффри Хинтоном — крестным отцом искусственного интеллекта и пионером глубокого обучения (deep learning). Хинтон поручил молодому исследователю улучшить алгоритм машинного обучения для визуализации данных SNE (Stochastic Neighbor Embedding), который разработал сам. Когда тот успешно справился с заданием, исследователи начали сотрудничать.
Уже в 2010 году Илья Суцкевер стал единственным канадским лауреатом международной премии Google PhD Fellowship Program, которой награждают молодых ученых, занимающихся инновационными исследованиями в области информационных технологий. Он работал над текстовой программой, которая после ввода символов может точно предсказывать последующие, а затем выступил соавтором статьи «Генерация текста рекуррентными нейронными сетями (RNN)». Именно эта технология сейчас широко используется в чат-ботах.
В 2012 году Хинтон, Суцкевер и Алекс Крижевский разработали систему AlexNet, которая может анализировать тысячи снимков и самостоятельно обучаться распознавать в реальности похожие объекты. Система выиграла ежегодный конкурс ImageNet и была признана новаторской. Это была первая работа, которая популяризировала сверточные нейронные сети в компьютерном зрении. С помощью них решаются задачи сегментации, классификации, детектирования и обработки изображений.
После этого успеха Хинтон, Суцкевер и Крижевский создали научно-исследовательский стартап DNNResearch для проектов компьютерного зрения, распознавания речи и понимания языка. Компанию приобрела Google. В 2013 году Илья Суцкевер перешел в подразделение IT-гиганта Google Brain по изучению искусственного интеллекта и машинному обучению.
В 2014 году он совместно с другими исследователями Google опубликовал статью, посвященную методу последовательного обучения нейросетей. Модель Seq2seq (Sequence-to-sequence, «последовательность к последовательности») принимает на вход последовательность элементов и возвращает ответ, учитывая контекст. С ее помощью серьезно обновили переводчик Google Translate.
Одновременно Суцкевер работал с исследователями DeepMind над AlphaGo — программой на основе искусственного интеллекта, которая играет в го. Ее новая версия AlphaFold смогла решить задачу сворачивания белков, что имеет решающее значение для разработки лекарств и борьбы с болезнями.
В команде Google Brain Суцкевер также занимался разработкой платформы TensorFlow — самой известной в мире системы машинного обучения. Это относительно простой инструмент, который позволяет создавать нейросети.
В 2015 году Суцкевер стал главным научным сотрудником и сооснователем компании OpenAI, идею которой предложил Илон Маск. Бизнесмен заявил о создании исследовательского центра для разработки цифрового интеллекта. Суцкевер начал заниматься неконтролируемым обучением нейросетей через сжатие данных. Он возглавил работу над созданием языковой модели GPT, которая впоследствии выросла до GPT-2, GPT-3, GPT-3.5 и GPT-4. Также Суцкевер участвовал в разработке DALL-E — нейросети для генерации изображений на основе описаний.
В интервью Крейгу С. Смиту, автору подкаста об искусственном интеллекте, Илья Суцкевер заявил, что ИИ может быть невероятно полезен практически в любой ситуации. Однако у него, как и многих других исследователей, есть опасения, что технологию можно использовать во вред человечеству
Суцкевер также отмечал: «Я бы предпочел мир, в котором люди по-прежнему свободны совершать ошибки и страдать от их последствий, постепенно эволюционировать и самостоятельно двигаться вперед, а искусственный интеллект обеспечивает скорее базовую подстраховку».
Сэм Альтман
Сэм Альтман — сооснователь и руководитель OpenAI до 17 ноября 2023 года. После неожиданного изгнания из компании всего через пять дней был приглашен занять свой прежний пост гендиректора OpenAI.
Родился в 1985 году в Чикаго, детство и юность провел в Миссури.
Свой первый компьютер Альтман получил в подарок в восьмилетнем возрасте и быстро увлекся программированием. Он поступил в Стэнфордский университет, чтобы изучать IT-технологии, но бросил учебу через год. После этого Сэм разработал приложение для смартфонов Loopt, которое позволяло пользователям выборочно сообщать другим людям свое местоположение в режиме реального времени. Стартап профинансировал акселератор Y Combinator. Через несколько лет Альтман продал Loopt за $43,4 млн и основал собственный венчурный фонд Hydrazine Capital, а еще через два года стал президентом Y Combinator.
В октябре 2015 года Альтман запустил некоммерческую исследовательскую лабораторию Y Combinator Research и вложил в нее $10 млн из своих денег. Ее целью стало изучение безусловного базового дохода, урбанистики и IT-технологий.
В том же 2015 году Альтман вместе с Илоном Маском основал OpenAI. Бизнесмены совместно с Amazon и Microsoft предоставили компании финансирование на общую сумму $1 млрд. Под руководством Альтмана OpenAI перестала быть некоммерческой организацией, а ее стоимость достигла $30 млрд.
В 2019 году Альтман вместе с исследователем и предпринимателем Алексом Бланией основал криптоплатформу Worldcoin. Главная отличительная особенность этой платформы — технология сканирования глаз для идентификации пользователей. Разработчики заявляют, что система будет различать людей и ботов, а также предоставит «форму всеобщего базового дохода, который может компенсировать потерю рабочих мест, вызванную повсеместным внедрением ИИ». Устройство Orb сканирует глаз и на основе этого создает для пользователя цифровой идентификатор World ID, который можно использовать «в широком спектре повседневных приложений без раскрытия личности». Криптовалюта была запущена 24 июля 2023 года.
Также сообщалось, что Альтман обсуждает сотрудничество с Джони Айвом, более 20 лет возглавлявшим подразделение дизайна в Apple. Они планируют создать устройство «эпохи искусственного интеллекта». Ранее Альтман инвестировал в стартап Humane, который готовится представить элементы «умной» одежды с функциями ИИ.
Альтман подписал письмо исследователей с предупреждением о последствиях неконтролируемого внедрения ИИ. На слушаниях в сенате США, прошедших в мае 2023 года, он заявил: «Я опасаюсь, что мы, индустрия, нанесем значительный вред миру. Государственное регулирование будет критически важным для снижения рисков». По мнению Альтмана, людям понадобится время, чтобы смириться с идеей соседства с новым мощным разумом, прежде чем он изменит все — от работы до человеческих отношений. В 2023 году журнал Time включил Сэма Альтмана в список 100 наиболее влиятельных людей планеты в категории «Пионеры».
Игорь Бабушкин
Игорь Бабушкин — разработчик, который возглавил команду в стартапе Илона Маска xAI.
Бабушкин окончил технический колледж в Германии и проходил летнюю практику в ЦЕРНе. Затем он устроился инженером-исследователем в британскую компанию искусственного интеллекта DeepMind, где проработал четыре года и участвовал в разработке AlphaStar — первой системы искусственного интеллекта, которая смогла победить лучших профессиональных киберспортсменов. Google выкупила компанию в начале 2014 года, а в 2023 году ее объединили с ИИ-подразделением Google Brain и переименовали в Google DeepMind.
Однако Бабушкин покинул первое место работы еще в 2020 году и присоединился к конкурирующей OpenAI в качестве участника команды технического персонала. Там он проработал почти два года, а в марте 2022-го вернулся обратно в DeepMind в качестве старшего штатного инженера-исследователя. В феврале 2023 года Бабушкин снова ушел из DeepMind. Тогда же стало известно, что Маск начал переманивать его в свой новый проект.
Под руководством Бабушкина xAI разработала Grok — чат-бот с генеративным искусственным интеллектом, который обладает чувством юмора и умеет отвечать на неудобные вопросы. ИИ обучали на данных соцсети X (Twitter), которая также принадлежит Маску. Сейчас чатбот доступен только ограниченному кругу пользователей.
Михаил Парахин
Михаил Парахин — бывший технический директор в «Яндексе», теперь занимает пост CEO в Microsoft по рекламе и веб-сервисам, развивает чат-бот Bing.
Парахин родился в 1977 году в Подмосковье. Он окончил МИФИ по специальности «физика пучков заряженных частиц и горячая плазма». В период учебы исследователь уже начал разрабатывать алгоритмы обработки изображений, в основном для систем мониторинга дорожного движения. Затем Парахин переехал в США и начал работать в компании Parascript в проекте по распознаванию и машинной обработке рукописных текстов.
В 2007 году исследователь пришел в Microsoft, где стал главным инженером, а потом и руководителем подразделения мультимедийных поисковых сервисов корпорации. Он развивал поисковик Bing.
В 2014 году Михаил Парахин устроился в компанию «Яндекс» и курировал работу нескольких отделов разработки, отвечающих за ранжирование, лингвистику и качество поиска, а также участвовал в создании алгоритма машинного обучения MatrixNet.
В 2015 году стал техническим директором компании и руководил развитием поискового портала. Под руководством Парахина «Яндекс» запустил русскоязычный голосовой помощник «Алиса», первую в России мультимедийную платформу на русском языке «Яндекс.Станция», новую версию переводчика с гибридной моделью и обновил поисковые алгоритмы.
В 2019 году Парахин ушел с поста в Москве и вернулся в США, но при этом продолжил консультировать «Яндекс».
Вскоре он снова пришел в Microsoft, где стал вице-президентом по технологиям. При этом в 2020 году Парахина переизбрали на год в качестве неисполнительного директора «Яндекса».
Теперь исследователь занимается в Microsoft развитием обновленного ИИ поисковика Bing, технологий рекламы и цифровых помощников. Парахин руководит командой, которая адаптирует возможности искусственного интеллекта для ОС Windows и устройств.
Андрей Дороничев
Андрей Дороничев — бывший директор по продуктам Google, разработчик мобильного приложения для YouTube. После ухода из Google основал компанию Optic, которая предлагает технологии распознавания ИИ-изображений.
Дороничев окончил Московский институт электроники и математики НИУ ВШЭ в 2005 году, позже переехал в США, где начал работать в Google. Будучи главой мобильной разработки, Андрей запустил версию YouTube для смартфонов, а на посту директора по продукту развивал операционную систему Android, платформу облачного гейминга Stadia и направление дополненной/виртуальной реальности. Дороничев также известен как инвестор в российские проекты, который запустил русскоязычный онлайн-проект Mesto — сообщество инвесторов и стартаперов.
В 2021 году Дороничев покинул Google после 14 лет работы, объявив, что будет «исследовать жизнь как инвестор, предприниматель и уличный музыкант».
В 2022 году Дороничев вместе с основателем компании по разработке решений на базе искусственного интеллекта EORA Романом Дорониным и руководителем отдела компьютерного зрения в EORA Владом Виноградовым запустил стартап Optic. Он предлагает технологию на основе искусственного интеллекта, которая помогает выявлять подделки цифровых активов на блокчейне. Первым клиентом Optic стал крупнейший NFT-маркетплейс OpenSea.
В марте 2023 года Optic запустил веб-сайт, где пользователи могут проверять изображения, чтобы определить, были ли они сделаны реальными людьми или искусственным интеллектом. Также компания работает над распознаванием видео- и аудиодипфейков. Дороничев предполагает, что Optic будет использоваться приложениями для знакомств и платформами социальных сетей для аутентификации фотографий профиля и защиты пользователей.
«Сейчас, когда генеративный искусственный интеллект становится взрывоопасной темой, я думаю, что существует еще одна проблема, гораздо более серьезная, чем подделка цифрового искусства, — достаточно скоро люди не смогут отличить, что реально, а что воображаемо. Я считаю, что мы живем в новую эпоху, которая будет по-настоящему пугающей, поскольку ИИ будет использоваться во всех видах кампаний по дезинформации. Наша работа — помочь людям оставаться в безопасности в мире контента, созданного искусственным интеллектом. Под безопасностью я подразумеваю предоставление инструментов, позволяющих обеспечить видение того, что является подлинным, что изменено ИИ и что создано ИИ», — считает Дороничев.
Иллюстрации: Олеся Мельникова и Midjourney. Источники: University of Toronto News, MIT Technology Review, The Varsity, ACM Digital Library, CBC, NeurIPS, Nature, Google DeepMind, arXiv, Wired, YouTube The New Yorker, Esquire, Bloomberg, TechCrunch, Y Combinator, Fortune, CNBC, Worldcoin, Semafor, The Information, Center for AI Safety, YouTube, The Atlantic, Time, xAI, LinkedIn, babushk.in, Google DeepMind, The Information LinkedIn, РИА Новости, vc.ru, «Яндекс», «Роем», «Интерфакс», The Verge, LinkedIn, Mesto, Instagram (соцсеть признана в РФ экстремистской и запрещена)*, Bioptic, AI or Not, The New York Times, Metaverse Post
* Принадлежит Meta — организация признана экстремистской и запрещена в РФ.