当地时间4月28日,英伟达发布开放式多模态大模型 Nemotron3Nano Omni。该模型整合视频、音频、图像与文本处理能力,采用30B-A3B混合专家(MoE)架构,将视觉与音频编码器直接集成,实现统一上下文的深度推理。官方数据显示,Nemotron3Nano Omni在文档处理、视频理解、音频感知等六项评测中领先,推理吞吐量较同类开放模型提升9倍。该模型支持独立运行或与其他云及开源模型协同,已被多家企业接入。作为英伟达 Nemotron3 系列关键成员,该系列累计下载量超5000万次。此次发布为企业级 AI 智能体的高效部署提供了新的技术基准。