DeepSeek V4: ефективність зростає, а міфи руйнуються

·Xataka
DeepSeek V4: ефективність зростає, а міфи руйнуються

Китайська компанія DeepSeek презентувала нову версію своєї мовної моделі V4, яка демонструє покращену ефективність та архітектуру, розроблену для китайських чипів. Однак, на відміну від очікувань, вона не стала революційною та підтвердила відставання від західних аналогів.

Що сталося

Китайська компанія DeepSeek представила свою нову мовну модель V4 під ліцензією MIT. Цей новий варіант має покращену архітектуру та код, розроблені спеціально для китайських чипів. Проте, згідно з власним технічним звітом компанії, V4 відстає від провідних західних моделей на 3-6 місяців.

Подробиці

DeepSeek V4 вводить новий мовний засіб TileLang, який дозволяє відокремити низькорівневий код від стандарту NVIDIA CUDA та компілювати його для різних чипів. Крім того, модель включає в себе ядро MegaMoE, розроблене для зниження затримки в паралелізмі експертів, яке вже працює на апаратному забезпеченні Ascend. Однак, незважаючи на ці інновації, навчання V4 все ще використовує графічні процесори NVIDIA, що свідчить про те, що компанія поки що не досягла повної незалежності від західних технологій.

Подробиці

Затримка з випуском V4 була спричинена низкою проблем, включаючи серйозний збій навчання у середині 2025 року під час спроби перейти від інфраструктури NVIDIA до чипів Ascend компанії Huawei. Крім того, внутрішні суперечки щодо технічного напрямку та вимоги засновника компанії, Ліанг Венфенга, призвели до затримок та обмежень у розробці. В результаті, V4 не став мультимодальною моделлю через брак обчислювальної потужності.

Що це означає

Для мешканців Іспанії цей розвиток подій означає, що китайська компанія DeepSeek, яка раніше розглядалася як потенційний конкурент західним розробкам у сфері штучного інтелекту, стикається з серйозними викликами. Відставання від західних аналогів та затримки з випуском інноваційних продуктів свідчать про те, що шлях до незалежності китайських технологій може бути довшим та складнішим, ніж очікувалося. Це також підкреслює проблеми, з якими стикаються компанії, що працюють у сфері штучного інтелекту, і необхідність інвестицій у розвиток інфраструктури та талантів.