NVIDIA выпускает Nemotron 3 Super, открытую модель 120B с контекстом в 1M токенов.

NVIDIA представила Nemotron 3 Super, новую языковую модель, сочетающую в себе несколько передовых технологий – включая LatentMoE, Multi-Token Prediction и новый метод обучения под названием NVFP4. NVIDIA утверждает, что эта комбинация повышает как производительность, так и скорость. По сравнению с предыдущей моделью Nemotron Super, она может обрабатывать информацию в 5 раз быстрее и достигать в 2 раза лучшей точности. Модель также может обрабатывать очень длинные тексты с поддержкой длины контекста до 1 миллиона токенов.


