
Як повідомляє TechCrunch.
DeepSeek стала вірусною темою цього тижня після того, як її чат-бот потрапив на вершини рейтингів в App Store та Google Play, привернувши увагу аналітиків i технолюбів. Це підкресливo зрушення в інтересі до штучного інтелекту та попиту на потужні AI-обчислення.
Походження DeepSeek тісно пов’язане з High-Flyer Capital Management – китайським квантовим фондом, який використовує штучний інтелект для інформування своїх торгових рішень.
Ідеолог AI-ентузіаст Лян Веньфень заснував High-Flyer у 2015 році; після студентських років у Університеті Чжецзян він запустив фонд у 2019 році, зосереджений на розробці та впровадженні AI-алгоритмів. У 2023 році High-Flyer започаткував DeepSeek як лабораторію для дослідження інструментів штучного інтелекту поза фінансовим бізнесом. Згодом лабораторія вийшла з цієї ініціативи та стала окремою компанією під назвою DeepSeek.
Ключові технології та інфраструктура
З самого початку DeepSeek створював власні кластерні дата-центри для навчання моделей. Але, як і багато китайських AI-компаній, він потрапив під дію американських експортних обмежень на обладнання. Для навчання однієї з новітніх моделей компанія була змушена використати чипи Nvidia H800, менш потужні за H100, доступні урядом США.
Команда DeepSeek відзначається молодим складом: компанія активно вербує докторів AI з провідних китайських університетів і навіть приймає людей без формальної комп’ютерної освіти, аби ширший спектр знань допоміг у розвитку технологій, повідомляє The New York Times.
Ключові моделі та їхня еволюція
Перший пакет моделей – DeepSeek Coder, DeepSeek LLM та DeepSeek Chat – компанія презентувала в листопаді 2023 року. Проте істотний інтерес індустрії з’явився навесні 2024 року з релізом сімейства DeepSeek-V2, яке поєднує обробку тексту та зображень і значно зменшує витрати на експлуатацію порівняно з конкурентами того часу. Це спровокувало зниження цін у деяких гравців ринку та зробило частину моделей доступними за нижчою ціною або безкоштовно.
У грудні 2024 року був представлений DeepSeek-V3, що ще більше підняв увагу до компанії. За внутрішнім бенчмаркінгом DeepSeek V3 перевершує відкриті моделі на зразок Meta Llama та «закриті» моделі з API, такі як OpenAI GPT-4o. Вражаючим є також «модель мислення» R1, випущена у січні, яка за заявами DeepSeek працює на рівні з найкращими моделями за ключовими бенчмарками.
За березень DeepSeek займав друге місце, попри те, що трафік знизився на 25% порівняно з лютим, за даними щоденних відвідувань.
R1 позиціонується як модель «розуміння», яка може перевіряти власні висновки, підвищуючи надійність у фізиці, науці та математиці. Разом з тим, як і інші рішення DeepSeek, вона підлягає регуляторному нагляду з боку китайських регуляторів щодо забезпечення відповідності відповідей громадським та соціальним очікуванням. Так, у деяких обговореннях R1 можуть бути обмеження на теми, пов’язані з Тяньаньменем або автономією Тайваню.
У березні DeepSeek зафіксував понад 16,5 мільйона відвідувань. За даними Similarweb, DeepSeek зайняв друге місце, незважаючи на зменшення трафіку на 25% порівняно з лютим, – підкреслив аналітик під час публікації про тенденції в галузі. Проте загалом DeepSeek випереджає за активністю ChatGPT, який у березні наблизився до півмільярда щотижневих користувачів.
У травні DeepSeek випустив оновлення для R1 на платформі Hugging Face. У вересні з’явилася експериментальна версія V3.2-exp, розроблена для значно нижчих витрат на висновки під час операцій із довгим контекстом – це знову зменшило витрати на використання системи.
Дивергентний підхід та ринки
Якщо говорити про бізнес-модель DeepSeek, точна формула не публічна. Компанія знижує ціни на свої продукти та послуги нижче середнього ринку, а деякі рішення роздає безкоштовно. Водночас інвестиційний потік практично відсутній, попри зацікавленість венчурних фондів.
Експерти пояснюють, що підвищена ефективність дозволяє підтримувати низьку вартість та конкурентоспроможність. Проте багато хто сумнівається у точності оприлюднених даних. Розробники активно використовують моделі DeepSeek, які не є відкритим кодом, але доступні за ліцензіями для комерційного використання. За словами Клема Деланга, CEO Hugging Face, на базі R1 було створено понад 500 деривативних моделей з мільйонами завантажень.
Успіх DeepSeek поставив під певний тиск більших гравців: його прибутковість розглядають як «перевернення AI» та іноді як «перекручення уваги» до інновацій. У деяких випадках це впливало на котирування Nvidia та викликало реакцію з боку провідних фахівців у сфері штучного інтелекту. Також урядові органи США вживали обмежувальні заходи щодо використання DeepSeek на держпристроях, повідомляє агенція новин.
Microsoft оголосила про доступність DeepSeek у своєму сервісі Azure AI Foundry, тоді як лідер Meta підкреслив: витрати на інфраструктуру AI залишаться стратегічною перевагою. OpenAI назвав DeepSeek «державно субсидованим» та «державно контрольованим» і закликав уряд США розглянути заборону його моделей. Натомість Nvidia підкреслив важливу роль DeepSeek як джерела інновацій для потреб обчислювальних потужностей. Деякі країни та регіони також ввели обмеження: серед них Південна Корея та Нью-Йорк заборонили використання DeepSeek на урядових пристроях.
У травні 2025 року представник Microsoft на слуханнях у Сенаті зазначив, що працівники компанії не можуть використовувати DeepSeek через питання безпеки даних та пропаганди. Майбутнє DeepSeek обіцяє появу нових моделей та посилення регуляторного нагляду з боку США, але компанія не виключає подальшого розвитку та подальшого зниження витрат на обчислення.
Усі ці події формують новий ландшафт штучного інтелекту: конкуренція між західними, азійськими та європейськими гравцями стає більш жорсткою, а регуляторні вимоги зумовлюють більш прозоре управління розробками штучного інтелекту.
Ця історія з’явилась наприкінці січня 2025 року і продовжує розвиватися – очікуйте нових моделей та оновлень щодо регуляторних змін у майбутньому.
Вас можуть зацікавити такі матеріали:
- Китайський DeepSeek розкрив витрати на навчання AI-моделі R1 – 294 тисячі доларів, що значно менше за оцінки західних конкурентів.
- Пекін різко відреагував на нові експортні обмеження США щодо китайських технологічних компаній, що загострює технологічну конкуренцію між країнами.
- Meta представила соцмережу Vibes з інструментами ШІ для створення та редагування відео, що дозволяє швидко генерувати та ділитися контентом.