英伟达推出多模态模型 Nemotron3Nano Omni，推理性能提升至同类 9 倍

当地时间4月28日，英伟达发布开放式多模态大模型 Nemotron3Nano Omni。该模型整合视频、音频、图像与文本处理能力，采用30B-A3B混合专家（MoE）架构，将视觉与音频编码器直接集成，实现统一上下文的深度推理。官方数据显示，Nemotron3Nano Omni在文档处理、视频理解、音频感知等六项评测中领先，推理吞吐量较同类开放模型提升9倍。该模型支持独立运行或与其他云及开源模型协同，已被多家企业接入。作为英伟达 Nemotron3 系列关键成员，该系列累计下载量超5000万次。此次发布为企业级 AI 智能体的高效部署提供了新的技术基准。

英伟达推出多模态模型 Nemotron3Nano Omni，推理性能提升至同类 9 倍

发表回复