NVIDIA роздає потужний ШІ безкоштовно — і заробляє на цьому більше, ніж конкуренти
4 червня 2026 року NVIDIA випустила Nemotron 3 Ultra — найбільшу відкриту ШІ-модель у лінійці Nemotron 3. Компанія оприлюднила за вільною ліцензією ваги моделі, навчальні дані та методики навчання. Модель створена для довготривалих автономних агентів та складних міркувань.
На відміну від закритих флагманів на кшталт ChatGPT або Claude, Nemotron 3 Ultra можна завантажити, донавчити на власних даних і запустити на власній інфраструктурі. Ставка тут робиться не на максимальний інтелект, а на відкритість, ефективність та контроль над моделлю.
Чим особлива архітектура моделі
Nemotron 3 Ultra — це не просто «збільшений трансформер». В її основі лежить гібридна архітектура, що складається з трьох різних підходів: шари Mamba-2, шари уваги (Attention) та латентна суміш експертів (Latent MoE) — механізм, який спрямовує кожен запит лише до потрібних «спеціалістів» всередині моделі.
Шари Mamba-2 обробляють довгі тексти швидко та економно: їхні витрати зростають лінійно з довжиною, а не лавиноподібно, як у звичайного механізму уваги. Шари уваги, своєю чергою, точно утримують у пам'яті великі обсяги тексту. А Latent MoE стискає дані перед тим, як передати їх експертам, завдяки чому кожен з них працює вузько та точно, не вимагаючи додаткових обчислень.
Загалом у моделі близько 550 млрд параметрів, але на обробку кожного токена задіюється лише приблизно 55 млрд. Завдяки цьому вона мислить як величезна система, а за витратами поводиться як значно компактніша. Разом із вікном контексту в 1 млн токенів та швидкістю понад 300 токенів на секунду це дає в п'ять-шість разів більшу пропускну здатність і приблизно на 30% нижчу вартість завдань.
Стратегія NVIDIA та ставка на екосистему
Головна цінність релізу, на думку галузевих аналітиків, не в самій моделі, а в екосистемі, яку NVIDIA вибудовує навколо свого обладнання. Логіка проста: той, хто запускає Nemotron, майже напевно робить це на відеокартах NVIDIA, донавчає за допомогою її програмних інструментів і розгортає на її ж програмному забезпеченні. Відкритість тут не благодійність, а спосіб привести розробників назад до купівлі обладнання компанії.
Влаштувати таке NVIDIA може тому, що її фінансові можливості непорівнянні з витратами на саму модель. При капіталізації понад $5 трлн навчання Nemotron 3 Ultra, яке коштувало, ймовірно, сотні мільйонів доларів, для компанії майже непомітна стаття витрат. Продажі відеокарт з лишком покривають дослідження, тому NVIDIA здатна роздавати модель безкоштовно і все одно заробляти більше, ніж закриті конкуренти беруть за платний доступ.
Додаткової ваги релізу надає політичний контекст. Відкриту американську модель можна перевірити, змінити та запустити на власних серверах — це зробило її привабливою для країн, які будують незалежний національний ШІ, від Європи до Південно-Східної Азії. Таку модель ніхто не вимкне віддалено, і це особливо цінно на тлі нещодавніх обмежень навколо закритих моделей.
У чому модель поступається і що буде далі
При всіх перевагах Nemotron 3 Ultra не найрозумніша модель на ринку. У незалежному рейтингу Artificial Analysis Intelligence Index вона набрала 48 балів — це найкращий результат серед відкритих моделей США, але у світі вона поступається лідерам, таким як Kimi K2.6 (54 бали) та DeepSeek. Відкриті моделі, за оцінками аналітиків, відстають від закритих на три-сім місяців.
Але це відставання, на мою думку, означає все менше, якщо відкритої моделі просто вистачає для реальних завдань. Банку, який ставить Nemotron 3 Ultra для обробки кредитів на своїх серверах, не потрібен інтелект флагманського рівня — потрібна модель, яку можна донавчити на закритих даних, тримати всередині свого захищеного контуру та не віддавати конфіденційні відомості стороннім.
Ставка NVIDIA на ефективність, а не на рекорди в тестах, може виявитися далекогляднішою. При масовому впровадженні ШІ на перший план виходить вартість роботи моделі, і та, що майже не поступається в розумі, але в п'ять разів дешевша, перемагає в реальній експлуатації. Аналітики очікують, що відкрита екосистема лише зміцнюватиметься: у NVIDIA є і ресурси, і мотивація, і канали поширення, щоб випускати все сильніші відкриті моделі швидше за будь-яку іншу компанію.
Думка експерта: У найближчі 12–18 місяців ми побачимо, як відкриті моделі на базі архітектури Nemotron стануть стандартом для enterprise-сектора, а закриті системи залишаться нішевим продуктом для завдань, де критична якість на рівні топ-1%. NVIDIA, роздаючи ШІ безкоштовно, фактично перекриває кисень конкурентам, які намагаються монетизувати доступ до своїх моделей. Це класичний приклад стратегії «бритва та леза», тільки в масштабах усієї індустрії.