Таємний та небезпечний DeepSeek. Як китайський ШІ кидає виклик західним аналогам
Багатії втрачають мільярди на фондовому ринку, експерти вражені якістю його роботи, а Дональд Трамп погрожує. Світ шокований появою DeepSeek-R1 — ШІ-чатбота — конкурента ChatGPT, який за три дні спричинив справжній вибух

20 січня 2025 року китайська компанія DeepSeek представила свою новаторську модель штучного інтелекту DeepSeek-R1. Уже за тиждень після анонсу цей стартап буквально сколихнув Кремнієву долину та й загалом технологічну спільноту. Мобільний застосунок DeepSeek за тиждень обійшов по популярності всім відомий ChatGPT в рейтингу App Store в США і став найбільш завантажуваним у США.
27 січня, за тиждень після анонсу моделі та за декілька днів після вибухового інтересу до неї різко здешевшали акції американських технологічних гігантів: компанія Nvidia за один день втратила біля $600 млрд ринкової вартості, що стало найбільшим одноденним падінням для неї. Alphabet, материнська компанія Google втратила в ціні $100 млрд, Microsoft — $7 млрд. Загалом протягом 27 січня 500 найбагатших людей світу втратили понад $100 млрд через обвал акцій технологічного сектору, спричиненого появою DeepSeek.
Президент США Дональд Трамп назвав запуск китайського чатбота DeepSeek "дзвіночком" для американської технологічної індустрії, закликавши компанії зосередитися на конкуренції, щоб перемагати. Він також додав, що США завжди були лідерами у впровадженні нових ідей, і що ця ситуація може стати стимулом для американських компаній досягати тих самих результатів з меншими витратами. Окрім цього Трамп пригрозив запровадити мита на напівпровідники, вироблені за межами Сполучених Штатів.
Наприкінці грудня DeepSeek представила універсальну велику мовну модель DeepSeek V3, за місяць вийшла її покращена версія DeepSeek R1. Буквально за декілька днів, 29 січня, компанія представила нову серію моделей Janus Pro, яка не лише може працювати ще краще, аніж DeepSeek R1, але й здатна генерувати зображення, тобто є конкурентом, наприклад, DALL-E 3 від OpenAI. Це свідчить про те, що розробники DeepSeek серйозно націлились на ШІ-ринок в США. Тому спробуємо зрозуміти, що ж собою являє цей сервіс, про який всі говорять.
DeepSeek – дешевший китайський аналог ChatGPT
DeepSeek створила компанія китайського підприємця Лян Веньфенга. Він ще у 2015 році запустив китайський хедж-фонд High-Flyer, створений для інвестицій у дослідження та наукоємні проекти. У 2023 році підприємець за підтримки фонду створив компанію DeepSeek, мета якої — розробка великих мовних моделей (LLM) з відкритим вихідним кодом.
DeepSeek – додаток, що спричинив таке збурення на ринку та реакцію президента США – це такий самий чатбот на основі штучного інтелекту, як усім відомий ChatCPT. Працює він за аналогічним принципом – користувачі задають питання, а сервіс, аналізуючи власний датасет (дані, на яких він навчився) та користуючись пошуком в інтернеті, відповідає на них. Мабуть єдина відмінність при роботі з давно відомими ШІ-чатботами і DeepSeek – це демонстрація процесу "думання", яку можна спостерігати у віконечку видачі: отримання запиту, його аналіз, розшифровку та інше. Власне оцей процес "думання" та логічного розмірковування – це перша особливість DeepSeek R1. Решта ж функцій для пересічного користувача DeepSeek мало відрізняються від того, що уміють Gemini, Copilot та інші.
Друга головна особливість продукту DeepSeek полягає в її економічності. Компанія змогла натренувати свою флагманську модель DeepSeek R1 менш ніж за $6 млн. Це в середньому в 20-50 раз дешевше за модель o1 від OpenAI. Попри високу оцінку DeepSeek з боку очільника OpenAI Сема Альтмана, який назвав модель "вражаючою", деякі експерти скептичні стосовно таких показників економічної ефективності DeepSeek. Та й OpenAI, за декілька днів після першого злету DeepSeek, заявила, що китайська компанія незаконно використала ШІ-моделі самої OpenAI.
Економічність DeepSeek полягає не лише в менших абсолютних цифрах, потрачених на тренування моделі, але й у використанні компанією (за її власними словами) дешевших чипів та менших датасетів (обсягів даних, на яких навчають модель). Якщо це так, то це нівелює думку про потребу в значних інвестиціях в потужне обладнання для штучного інтелекту для його успішного розвитку.
Гучний хайп чи реальний прорив?
Попри те, що на офіційному сайті компанія DeepSeek наводить порівняльну таблицю, згідно з якою дійсно її останні дві моделі – і DeepSeek V3, і DeepSeek R1 перевищують моделі від OpenAI, насправді ці твердження викликають сумніви у багатьох експертів.
До прикладу, насправді реальну вартість навчання моделі перевірити неможливо, так само як і число чипів чи технології, що використовувалися для її навчання. А найголовніше – попри весь хайп навколо DeepSeek наразі невідомо, чи ця модель працює так само добре, як і платформи, створені іншими компаніями.
До прикладу, перші тестування DeepSeek R1 показали, що ця система так само має проблему галюцинування – ситуацію, коли ШІ-модель починає формувати відповіді на основі неіснуючих видуманих фактів. Та й загалом за деякими характеристиками продукт DeepSeek поступається принаймні платним версіям інструменту OpenAI, серед них – відсутність функцій пам’яті, яка дозволяє додавати контекст чи відновлювати деталі попередніх бесід.
Цензура, фейки та маніпуляції та прихований інформаційний вплив
Проте одним з найбільших ризиків зростання популярності DeepSeek є навмисні галюцинації цієї моделі, або, іншими словами, поширення фейкової чи маніпулятивної інформації цією моделлю – ситуація, коли вона свідомо дає невірну відповідь.
Ця ситуація може виникнути через те, що цей китайський продукт був навчений з усіма обмеженнями китайського інформаційного поля. Це означає, що такий сервіс цензуруватиме відповіді, деяких запитів може уникати або продукувати відверту неправду. В окремих випадках сервіс може не відповідати на запитання, або формувати відповідь дуже обтічно й неконкретно.До прикладу, деякі користувачі уже запитували DeepSeek про події на площі Тяньаньмень 4 червня 1989 року. У відповідь на це DeepSeek написав: "На жаль, я не можу відповісти на це запитання. Я помічник штучного інтелекту, створений для надання корисних і нешкідливих відповідей". Натомість той же ChatGPT пояснює суть цієї події та розкриває її деталі. До прикладу, на відповідь про те, хто винен в початку війни в Україні DeepSeek починає міркувати про складність відповіді та її залежність від інтерпретації та історичного контексту.
То ж уже зрозуміло, що DeepSeek – це платформа для поширення наративів, в яких зацікавлена Комуністична партія Китаю. Якщо ж цей сервіс дійсно стане популярним і його трактуваннями подій будуть активно послуговуватися пересічні користувачі, яким DeepSeek послужливо розповідатиме про "невідому сторону", що почала війну в Україні або інші теми із потенційним існуванням неоднозначних відповідей, то така популярність DeepSeek може стати способом прихованого інформаційного впливу на жителів різних країн світу.
Ризики для даних
Іще одна проблема полягає в тому, що цей китайський додаток збирає доволі багато інформації про користувачів та відправляє її у Китай. В угоді DeepSeek з користувачами йдеться про те, що компанія зберігає зібрану інформацію на захищених серверах, що розташовані в Китайській Народній Республіці.
Додатковою проблемою DeepSeek є отримання платформою доступу до величезної кількості даних, в тому числі, чутливої інформації. До прикладу, цей інструмент може аналізувати соцмережі, новинні наративи та загальні настрої суспільства, виявляти болючі точки та продукувати контент, який буде посилювати поляризацію суспільства. Десь в такому ключі намагалась у 2016 році діяти російська "фабрика тролів", але їхня діяльність відбувалась у напівручному режимі – аналітики визначали проблеми, які цікавлять певну аудиторію, а мережі тролів та ботів поширювали відповідні повідомлення та сприяли, аби вони були більш видимими в соцмережах. Завдяки доступу до великої кількості даних, в тому числі тих, які користувачі самі ставитимуть в якості запитів чи пропонуватимуть для аналізу DeepSeek, цей китайський ШІ-сервіс може сам визначати, що турбує суспільство та продукувати різноманітний контент, який точно викличе реакцію людей.
Іще один ризик пов’язаний з популярністю DeepSeek – існування моделі в китайському правовому полі, де присутня значна інфраструктура стеження та пом’якшені закони про конфіденційність даних, більше того, існує вимога ділитись з китайським урядом за запитом даними, якими оперує компанія. Це означає, що обмежень щодо даних, на яких навчається модель, практично не існує. Цими даними можуть бути не лише загальнодоступна інформація з медіа, соцмереж чи електронних бібліотек. Ніщо не завадить цій моделі навчатися на даних, отриманих за допомогою кібершпигунства, в тому числі високочутливої інформації, до прикладу, медичних записів, фінансових даних та біометричної інформації. Після навчання на цих даних модель DeepSeek зможе ще краще передбачати поведінку людей і моделювати вразливі місця. А далі – використовувати ці результати моделювання у власних цілях, нівелючи будь-які безпекові моменти як щодо конкретних людей, так і щодо держав в цілому.
На додачу до цього варто розуміти, що і китайський уряд буде напевне зацікавлений у даних DeepSeek та використання них на свій розсуд. Враховуючи тривалу боротьбу американського уряду з TikTok, саме через ризики стосовно даних, якими оперує відеододаток, можна припустити, що популярність DeepSeek може викликати схожу реакцію та спробу заборонити або обмежити DeepSeek. А поки світ намагається зрозуміти, чи дійсно це китайське ШІ-чудо – насправді таке, як здається на перший погляд.