NVIDIA выпускает Nemotron 3 Super, открытую модель 120B с контекстом в 1M токенов.

NVIDIA запускает SUPER, но не тот SUPER, которого хотели геймеры.

NVIDIA недавно запустила Nemotron 3 Super, мощную AI-модель с 120 миллиардами параметров, предназначенную для продвинутых AI-задач. Она сочетает в себе две различные архитектуры, Mamba и Transformer, и эффективно использует только 12 миллиардов параметров во время работы. Этот дизайн позволяет NVIDIA снизить стоимость запуска модели по сравнению с традиционными, более крупными моделями.

Инвестируйте с умом. Наш канал посвящен глубокому анализу фондового рынка: отчетность, мультипликаторы и долгосрочные стратегии.

Получить инвест-идеи

NVIDIA представила Nemotron 3 Super, новую языковую модель, сочетающую в себе несколько передовых технологий – включая LatentMoE, Multi-Token Prediction и новый метод обучения под названием NVFP4. NVIDIA утверждает, что эта комбинация повышает как производительность, так и скорость. По сравнению с предыдущей моделью Nemotron Super, она может обрабатывать информацию в 5 раз быстрее и достигать в 2 раза лучшей точности. Модель также может обрабатывать очень длинные тексты с поддержкой длины контекста до 1 миллиона токенов.

Этот релиз включает в себя не только основную модель. NVIDIA также делится различными версиями модели – включая оптимизированные, более компактные – в нескольких форматах, а также наборами данных и инструкциями, использованными для её создания. Полный проект Nemotron 3 использует более 10 триллионов текстовых данных как для начального обучения, так и для доработки, и также включает в себя симулированные среды для дальнейшего улучшения производительности модели.

NVIDIA рекламирует Nemotron 3 Super для приложений, таких как командные AI-помощники и обработка больших объемов работы, что соответствует его первоначальному описанию версии Super в прошлом году. NVIDIA подчеркивает, что модель лучше всего подходит для таких задач, как кодирование, понимание объемных документов и использование различных программных инструментов.

Объявляем о NVIDIA Nemotron 3 Super!

Представляем мощную новую языковую модель – гибридную модель Mixture-of-Experts (MoE) с 120 миллиардами параметров, созданную для архитектуры Blackwell. Она достигает производительности до 2,2 раза быстрее, чем GPT-OSS-120B, используя точность FP4, и является полностью открытой – включая данные, используемые для её обучения, конструкцию модели и сами веса модели.

Модели, технический отчёт и т.д. здесь:

И да, Ultra скоро появится!

— Bryan Catanzaro (@ctnzr) March 11, 2026

Nemotron 3 Super будет широко доступен сразу после запуска. Вы можете получить доступ к нему через build.nvidia.com, Hugging Face, OpenRouter и Perplexity. Несколько облачных и AI-сервисов также будут поддерживать модель, включая Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI и Modal. Кроме того, NVIDIA предлагает модель как предварительно упакованный сервис для использования на ваших собственных серверах или в облаке.

Смотрите также

2026-03-11 19:34