Nvidia створила модель ШІ, яка читає, бачить і чує одночасно

Nvidia представила нову модель ШІ Nemotron 3 Nano Omni, яка здатна інтегрувати дані з різних джерел і сприймати світ подібно до людини.
Що сталося
Nvidia анонсувала нову модель штучного інтелекту Nemotron 3 Nano Omni, яка здатна одночасно читати, бачити і чути інформацію. Ця модель є частиною напрямку розвитку фізичної робототехніки та інтегрованої ШІ.
Подробиці
Nemotron 3 Nano Omni є мультимодальною моделлю, яка використовує єдину архітектуру нейронної мережі для обробки різних типів даних, таких як аудіо, відео, текст та зображення. Це дозволяє їй реагувати на стимули більш природно та швидко. Модель має 30 мільярдів параметрів і здатна працювати в 9 разів швидше за інші моделі. Nemotron 3 Nano Omni може використовуватися для створення інтелігентних агентів, які можуть сприймати та інтерпретувати інформацію з різних джерел.
Подробиці
Модель здатна інтерпретувати документи, графіки та таблиці, а також розуміти аудіо- та відеоінформацію. Вона також може використовуватися для розробки агентів, які можуть орієнтуватися в графічних інтерфейсах користувача та розуміти інформацію на екрані в реальному часі. Nemotron 3 Nano Omni буде доступна для використання через платформи, такі як Hugging Face, та буде орієнтована на професійне використання.
Що це означає
Для мешканців Іспанії ця технологія відкриває нові можливості для використання ШІ у різних галузях, таких як бізнес та промисловість. Це може призвести до створення нових продуктів та послуг, які будуть використовувати інтелігентних агентів для допомоги у повсяденному житті. Однак, для широкого використання цієї технології ще потрібно вирішити питання щодо її доступності та вартості.