Тайный и опасный DeepSeek. Как китайский ИИ бросает вызов западным аналогам
Богачи теряют миллиарды на фондовом рынке, эксперты поражены качеством его работы, а Дональд Трамп угрожает. Мир шокирован появлением DeepSeek-R1 — ИИ-чат-бота — конкурента ChatGPT, который за три дня вызвал настоящий взрыв

20 января 2025 г. китайская компания DeepSeek представила свою новаторскую модель искусственного интеллекта DeepSeek-R1. Уже через неделю после анонса этот стартап буквально всколыхнул Кремниевую долину и вообще технологическое сообщество. Мобильное приложение DeepSeek за неделю обошло по популярности всем известный ChatGPT в рейтинге App Store в США и стало самым загружаемым в США.
27 января, через неделю после анонса модели и через несколько дней после взрывного интереса к ней резко подешевели акции американских технологических гигантов: компания Nvidia за один день потеряла около $600 млрд рыночной стоимости, что стало наибольшим однодневным падением для нее. Alphabet, материнская компания Google потеряла в цене $100 млрд, Microsoft — $7 млрд. Всего в течение 27 января 500 самых богатых людей мира потеряли более $100 млрд из-за обвала акций технологического сектора, вызванного появлением DeepSeek.
Президент США Дональд Трамп назвал запуск китайского чата DeepSeek "звоночком" для американской технологической индустрии, призвав компании сосредоточиться на конкуренции, чтобы побеждать. Он также добавил, что США всегда были лидерами во внедрении новых идей, и что эта ситуация может стать стимулом для американских компаний достигать тех же результатов с меньшими затратами. Кроме того, Трамп пригрозил ввести пошлины на полупроводники, произведенные за пределами Соединенных Штатов.
В конце декабря DeepSeek представила универсальную крупную языковую модель DeepSeek V3, за месяц вышла ее улучшенная версия DeepSeek R1. Буквально за несколько дней, 29 января, компания представила новую серию моделей Janus Pro, которая не только может работать еще лучше, чем DeepSeek R1, но и способна генерировать изображения, то есть является конкурентом, например, DALL-E 3 от OpenAI. Это свидетельствует о том, что разработчики DeepSeek серьезно нацелились на ИИ-рынок в США. Поэтому попытаемся понять, что же из себя представляет этот сервис, о котором все говорят.
DeepSeek – более дешевый китайский аналог ChatGPT
DeepSeek создала компания китайского предпринимателя Лян Вэньфенга. Еще в 2015 году он запустил китайский хедж-фонд High-Flyer, созданный для инвестиций в исследования и наукоемкие проекты. В 2023 году предприниматель при поддержке фонда создал компанию DeepSeek, цель которой – разработка крупных языковых моделей (LLM) с открытым исходным кодом.
DeepSeek – приложение, вызвавшее такое возмущение на рынке и реакцию президента США – это такой же чат-бот на основе искусственного интеллекта, как всем известный ChatCPT. Работает он по аналогичному принципу – пользователи задают вопросы, а сервис, анализируя свой датасет (данные, на которых он научился) и пользуясь поиском в интернете, отвечает на них. Пожалуй, единственное отличие при работе с давно известными ИИ-чатботами и DeepSeek – это демонстрация процесса "думания", которую можно наблюдать в окошечке выдачи: получение запроса, его анализ, расшифровку и прочее. Собственно этот процесс "думания" и логического размышления – это первая особенность DeepSeek R1. Остальные функции для обычного пользователя DeepSeek мало отличаются от того, что умеют Gemini, Copilot и другие.
Вторая главная особенность продукта DeepSeek заключается в ее экономичности. Компания смогла натренировать свою флагманскую модель DeepSeek R1 менее чем за $6 млн. Это в среднем в 20-50 раз дешевле модели o1 от OpenAI. Несмотря на высокую оценку DeepSeek со стороны главы OpenAI Сэма Альтмана, который назвал модель "впечатляющей", некоторые эксперты скептичны по отношению к таким показателям экономической эффективности DeepSeek. Да и OpenAI, через несколько дней после первого взлета DeepSeek, заявила, что китайская компания незаконно использовала ИИ-модели самой OpenAI.
Экономичность DeepSeek заключается не только в меньших абсолютных цифрах, потраченных на тренировку модели, но и в использовании компанией (по ее собственным словам) более дешевых чипов и меньших датасетов (объемов данных, на которых обучают модель). Если это так, то это нивелирует мнение о необходимости значительных инвестиций в мощное оборудование для искусственного интеллекта для его успешного развития.
Громкий хайп или реальный прорыв?
Несмотря на то, что на официальном сайте компания DeepSeek приводит сравнительную таблицу, согласно которой действительно ее последние две модели – и DeepSeek V3, и DeepSeek R1 превышают модели от OpenAI, эти утверждения вызывают сомнения у многих экспертов.
К примеру, реальную стоимость обучения модели проверить невозможно, равно как и число чипов или технологии, которые использовались для ее обучения. А самое главное – несмотря на весь хайп вокруг DeepSeek, пока неизвестно, работает ли эта модель так же хорошо, как и платформы, созданные другими компаниями.
К примеру, первые тестирования DeepSeek R1 показали, что эта система также имеет проблему галлюцинирования – ситуацию, когда ИИ-модель начинает формировать ответы на основе несуществующих вымышленных фактов. Да и в целом по некоторым характеристикам продукт DeepSeek уступает, по крайней мере, платным версиям инструмента OpenAI, среди них отсутствие функций памяти, позволяющей добавлять контекст или восстанавливать детали предыдущих бесед.
Цензура, фейки и манипуляции и скрытое информационное воздействие
Однако одним из наибольших рисков роста популярности DeepSeek являются умышленные галлюцинации этой модели или, другими словами, распространение фейковой или манипулятивной информации этой моделью – ситуация, когда она сознательно дает неверный ответ.
Эта ситуация может возникнуть из-за того, что этот китайский продукт был обучен со всеми ограничениями китайского информационного поля. Это означает, что такой сервис будет цензурировать ответы, некоторые запросы могут избегать или продуцировать откровенную ложь. В отдельных случаях сервис может не отвечать на вопросы или формировать ответ очень обтекаемо и неконкретно. К примеру, некоторые пользователи уже спрашивали DeepSeek о событиях на площади Тяньаньмэнь 4 июня 1989 года. В ответ на это DeepSeek написал: "К сожалению, я не могу ответить на этот вопрос. Я помощник искусственного интеллекта, созданный для предоставления полезных и безвредных ответов". В то же время ChatGPT объясняет суть этого события и раскрывает его детали. К примеру, ответ на то, кто виноват в начале войны в Украине DeepSeek начинает рассуждать о сложности ответа и его зависимости от интерпретации и исторического контекста.
Это уже понятно, что DeepSeek – это платформа для распространения нарративов, в которых заинтересована Коммунистическая партия Китая. Если же этот сервис действительно станет популярным и его трактовками событий будут активно пользоваться рядовые пользователи, которым DeepSeek будет услужливо рассказывать о "неведомой стороне", начавшей войну в Украине или других темах с потенциальным существованием неоднозначных ответов, то такая популярность DeepSeek может стать способом скрытого информационного влияния на жителей разных стран мира.
Риски для данных
Еще одна проблема состоит в том, что это китайское приложение собирает достаточно много информации о пользователях и отправляет ее в Китай. В соглашении DeepSeek с пользователями говорится, что компания хранит собранную информацию на защищенных серверах, расположенных в Китайской Народной Республике.
Дополнительной проблемой DeepSeek является получение платформой доступа к множеству данных, в том числе, чувствительной информации. Например, этот инструмент может анализировать соцсети, новостные нарративы и общие настроения общества, выявлять болезненные точки и продуцировать контент, который будет усиливать поляризацию общества. Где-то в таком ключе пыталась в 2016 году действовать российская "фабрика троллей", но их деятельность происходила в полуручном режиме — аналитики определяли интересующие определенную аудиторию проблемы, а сети троллей и ботов распространяли соответствующие сообщения и способствовали, чтобы они были более видимыми в соцсетях.. Благодаря доступу к большому количеству данных, в том числе тех, которые пользователи сами будут задавать в качестве запросов или предлагать для анализа DeepSeek, этот китайский МИ-сервис может сам определять, что беспокоит общество и продуцировать разнообразный контент, который точно вызовет реакцию людей.
Еще один риск связан с популярностью DeepSeek – существование модели в китайском правовом поле, где присутствует значительная инфраструктура слежения и смягченные законы о конфиденциальности данных, более того, существует требование делиться с китайским правительством по запросу данными, которыми оперирует компания. Это означает, что ограничений по данным, на которых учится модель, практически не существует. Этими данными могут быть не только общедоступная информация из медиа, соцсетей или электронных библиотек. Ничто не помешает этой модели учиться на данных, полученных с помощью кибершпионажа, в том числе высокочувствительной информации, например, медицинских записей, финансовых данных и биометрической информации. После обучения этим данным модель DeepSeek сможет еще лучше предвидеть поведение людей и моделировать уязвимые места. А дальше – использовать эти результаты моделирования в собственных целях, нивелируя любые моменты безопасности как в отношении конкретных людей, так и в отношении государств в целом.
Вдобавок к этому следует понимать, что и китайское правительство будет наверняка заинтересовано в данных DeepSeek и использовании их по своему усмотрению. Учитывая длительную борьбу американского правительства с TikTok, именно из-за рисков относительно данных, которыми оперирует видеоприложение, можно предположить, что популярность DeepSeek может вызвать похожую реакцию и попытку запретить или ограничить DeepSeek. А пока мир пытается понять, действительно ли это китайское ИИ-чудо – действительно такое, как кажется на первый взгляд.