Китайское техно
Краткая история технологического идеализма

26 декабря китайский стартап DeepSeek в Ханчжоу представил новое поколение больших моделей DeepSeek-V3. В многочисленных тестах его производительность оказалась выше, чем у других моделей с открытым исходным кодом. В математических рассуждениях DeepSeek-V3 и вовсе оставил всех далеко позади. Телеканал CNBC сообщил: «Новая модель заставляет гудеть всю долину!», А американский фондовый рынок рухнул на триллион долларов.
УДИВИТЕЛЬНО, но, хотя производительность DeepSeek-V3 сопоставима с топовой большой моделью GPT-4o (с закрытым исходным кодом), ее разработка обошлась всего в 5,58 млн долл., а стоимость обучения составляет менее 1/20 последней. Чтобы добиться аналогичного результата, Google и OpenAI потребовалось несколько лет, миллиарды долларов и десятки тысяч самых современных графических процессоров.
Старт DeepSeek-V3 странным образом совпал с появлением у китайских ВВС самолета шестого поколения, который американцы сравнили с запуском СССР первого искусственного спутника. Однако по-настоящему потрясла Кремниевую долину не высокая производительность и низкая стоимость DeepSeek-V3, а новаторский дух модели. До этого считалось, что технологические прорывы свойственны США, в то время как Китай хорош только в приложениях. Еще более удивительным оказалось то, что за DeepSeek-V3 стояли не азиатские технологические гиганты типа Tencent или Ali, а скромный фонд прямых инвестиций Magic Square Quantitative, которым бессменно руководил технологический гик Лян Вэньфэн.
СЕКРЕТ ФИРМЫ Компания DeepSeek окутана тайной. Ее головной офис в Пекине занимает целый этаж, 2100 кв. м. Адрес известен, но охрана внизу не скажет даже номер этажа, нет в холле и вывески с названием. Мало того, с недавнего времени на этаже поставили дополнительную охрану. Проникнуть в DeepSeek ежедневно стремятся более ста человек, но, как правило, безуспешно. То же самое происходит с телефонами и электронной почтой: их все знают, однако связаться с сотрудниками не удается. Хотя до недавнего времени никакого ажиотажа не было. «В 2023 году мне предлагали работу в этой компании, но я вообще не обратил на нее внимания, – рассказывает ведущий китайский разработчик в области ИИ. – Сейчас я был бы рад перейти туда, да кто ж предложит».