DeepSeek ломает парадигму ИИ

О DeepSeek я расскажу чуть позже, но сначала хочу сделать несколько объявлений.
Конференция интеллектуальных инвесторов
Конференция интеллектуальных инвесторов (ранее известная как VALUEx Vail) пройдет 11-13 июня в Вейле. Единственное, что изменилось, - это название. Это по-прежнему некоммерческое мероприятие по обмену знаниями с количеством участников не более 40 человек, предназначенное для инвесторов в ценные бумаги, чтобы собраться вместе в прекрасном Вейле и обменяться идеями. Подать заявку и ознакомиться с презентациями прошлых лет можно на сайте
https://conference.investor.fm/
IMA нанимает инженера по искусственному интеллекту
IMA ищет специалиста по искусственному интеллекту в нашу команду. Мы не уверены на 100% в точном наборе навыков, но в идеале нам нужен человек с сильным инженерным образованием/образованием в области ИИ, который также имеет легкую одержимость инвестированием в стоимость (не обязательно быть экспертом в области инвестирования). Если вы знаете кого-то, кто заинтересован, пожалуйста, отправьте его сюда.
Я получаю письма от читателей, которые спрашивают, что я думаю о DeepSeek. Я должен начать с двух предупреждений. Первое - обычное: Я универсальный стоимостной инвестор, а не специалист по технологиям (на прошлой неделе я анализировал банк и нефтяную компанию), поэтому мои знания о моделях искусственного интеллекта поверхностны. Во-вторых, что более необычно, у нас еще нет всех фактов.
Но эта история может стать серьезным шагом вперед как в области ИИ, так и в геополитике. Вот что нам известно:
DeepSeek - годовалый китайский стартап, вышедший из хедж-фонда, - создал полностью функционирующую большую языковую модель (LLM), которая работает наравне с новейшими моделями ИИ. Эта часть истории была подтверждена индустрией: DeepSeek была протестирована и сравнена с другими лучшими LLM. Я лично играл с DeepSeek в течение последних нескольких дней, и результаты, которые он выдавал, были очень похожи на результаты ChatGPT и Perplexity - только быстрее.
Это само по себе впечатляет, особенно если учесть, что всего полгода назад Эрик Шмидт (бывший генеральный директор Google, и уж точно не универсал) заявил, что Китай отстает от США в области ИИ на два-три года.
Но вот что действительно шокирует и не подтверждается: DeepSeek утверждает, что обучила свою модель всего за 5,6 миллиона долларов, в то время как американские коллеги, как сообщается, потратили сотни миллионов или даже миллиарды долларов. Это в 20-200 раз меньше.
Последствия, если это правда, ошеломляют. Несмотря на то, что правительство США контролирует экспорт чипов ИИ в Китай, DeepSeek якобы обучала свой LLM на чипах старого поколения, используя лишь малую часть вычислительной мощности и электроэнергии, которыми располагают западные конкуренты. В то время как все полагали, что будущее ИИ - за более быстрыми и качественными чипами, где единственный реальный выбор - Nvidia или Nvidia, эта ранее неизвестная компания достигла почти паритета со своими американскими коллегами, купающимися в деньгах и дата-центрах, заполненных новейшими чипами Nvidia. У DeepSeek (как утверждается) были огромные ограничения на вычисления, и поэтому ей пришлось использовать другую логику, став более эффективной при использовании некачественного оборудования для достижения аналогичного результата. Другими словами, этот захудалый стартап, стремясь создать лучший ИИ-«мозг», использовал мозги там, где все остальные делали упор на мускулы - он буквально учил ИИ рассуждать.
Участвуйте в конкурсе хот-догов
Американцы любят (нездоровую) пищу и спорт, поэтому позвольте мне объяснить это с помощью аналогии «еда-спорт». Международный конкурс по поеданию хот-догов Nathan's Famous утверждает, что его начало приходится на 1916 год (хотя это может быть отчасти легендой). К 1970-м годам, когда начались официальные записи, победители конкурса в среднем съедали около 15 хот-догов. Постепенно этот показатель вырос до 25, пока в 2001 году из Японии не приехал Такеру Кобаяси и не разрушил парадигму, съев 50 хот-догов, что многие считали невозможным. Его секрет заключался не в непомерном аппетите, а в уникальной методике: он отделял хот-доги от булочек и макал булочки в воду, полностью переосмыслив подход.
Спустя несколько лет появился Джоуи Честнат, который, опираясь на инновации Кобаяси, довел рекорд до 70 хот-догов и 83. Как только Кобаяси сломал парадигму, все видимые ограничения исчезли, заставив всех пересмотреть свои методы. Джоуи Честнат воспользовался этим.
DeepSeek может стать Кобаяси искусственного интеллекта, ввергнув всю индустрию в эру инноваций «Джоуи Честната». Если заявления об использовании старых чипов и значительно меньших затратах окажутся правдивыми, мы увидим, как компании, занимающиеся разработкой ИИ, перейдут от погони за большими вычислительными мощностями к улучшению дизайна моделей.
Я никогда не думал, что буду цитировать стоиков для объяснения будущего спроса на чипы GPU, но Эпиктет сказал: «Счастье приходит не от желания получить больше, а от желания получить то, что имеешь». Два тысячелетия назад он, конечно, не говорил о графических процессорах, но вполне мог. ChatGPT, Perplexity и Gemini от Google должны переосмыслить свое стремление к большим вычислениям и понять, смогут ли они достичь большего, желая (используя) то, что у них есть.
Если они этого не сделают, их съедят сотни новых стартапов, корпораций и, скорее всего, правительств, которые придут в это пространство. Когда вы начинаете писать миллиарды через «м», вы резко снижаете барьеры для входа.
До появления DeepSeek предполагалось, что искусственный интеллект будет доступен лишь нескольким чрезвычайно хорошо финансируемым компаниям («Великолепным»), вооруженным новейшими чипами Nvidia. Возможно, DeepSeek разрушил и эту парадигму.
Загадка Nvidia
Последствия для Nvidia неясны. С одной стороны, успех DeepSeek может снизить спрос на ее чипы и вернуть ее прибыль на землю, поскольку компании осознают, что светлое будущее ИИ может заключаться не в простом подключении большего количества процессоров Nvidia, а в повышении эффективности работы моделей. Возможно, DeepSeek уменьшил необходимость строить больше центров обработки данных и тем самым сократил спрос на чипы Nvidia.
С другой стороны (здесь я выступаю в роли двурукого экономиста), снижение барьеров для входа приведет к появлению большего числа участников и повышению общего спроса на GPU. Кроме того, DeepSeek утверждает, что, поскольку ее модель более эффективна, стоимость вычислений (запуск модели) составляет долю стоимости запуска ChatGPT и требует гораздо меньше памяти, что потенциально ускоряет внедрение ИИ и, следовательно, повышает спрос на GPU. Так что это может быть хорошей новостью для Nvidia, в зависимости от того, как все сложится.
Мое мнение о Nvidia существенно не изменилось - это лишь вопрос времени, когда Meta, Google, Tesla, Microsoft и множество стартапов сделают GPU коммодитиз и снизят цены.
Аналогичным образом, усиление конкуренции означает, что LLM, скорее всего, сами станут товарными - именно это делает конкуренция, и оценка ChatGPT может стать очевидной жертвой.
Геополитические потрясения
Геополитические последствия огромны. Экспортный контроль, возможно, нечаянно подстегнул новые инновации, и в будущем он может оказаться не столь эффективным. США, возможно, не смогут контролировать ИИ, как многие считали, и страны, которые нас не очень любят, будут иметь свой собственный ИИ.
После перевода производства в Китай мы долгое время утешали себя тем, что являемся колыбелью инноваций, но ИИ может склонить чашу весов не в нашу пользу.
Позвольте мне привести пример. В недавнем интервью Wall Street Journal руководитель отдела продуктов OpenAI рассказал, что различные версии ChatGPT анонимно участвовали в конкурсах по программированию. Из примерно 28 миллионов программистов по всему миру эти ранние модели попали в 2-3 % лучших. ChatGPT-o1 (последняя публичная версия) вошла в 1000 лучших, а ChatGPT-o3 (выйдет через несколько месяцев) - в 175 лучших. Это 0,000625% лучших! Если бы это был композитор, ChatGPT-o3 был бы Моцартом.
Я слышал, что великий разработчик в 10 раз ценнее хорошего, а может быть, даже в 100 раз ценнее среднего. Я стараюсь быть примерно прав. 19-летний подросток из Бангалора или Айовы, который познакомился с программированием несколько месяцев назад, теперь может кодить как Моцарт, используя новейший ChatGPT. Представьте себе, что каждый молодой человек после нескольких видеороликов на YouTube кодирует на таком уровне. Разрыв в знаниях и опыте стремительно сокращается.
Я прекрасно понимаю, что сильно обобщаю (не могу не подчеркнуть это), но смысл остается в силе: Путь от обучения коду до превращения в «Моцарта программирования» сократился с десятилетий до нескольких месяцев, а число таких Моцартов растет в геометрической прогрессии. Если бы я владел софтверными компаниями, я бы стал немного более нервным - ров для многих из них был заполнен искусственным интеллектом.
Приспосабливаться, менять свое мнение и рассматривать идеи как тезисы, которые нужно подтвердить или опровергнуть, а не как часть своей личности - это невероятно важно в инвестировании (и в жизни в целом). Они становятся еще более важными в эпоху ИИ, поскольку мы оказываемся в фантастической реальности быстрее, чем могли себе представить. DeepSeek может стать таким катализатором, заставляя инвесторов и технологов подвергать сомнению давно устоявшиеся предположения и переоценивать конкурентную среду в режиме реального времени.
Статья на английском языке доступна здесь.