英伟达推出新一代开放式多模态模型 Nemotron 3 Nano Omni,将视频、音频、图像与文本推理整合于同一系统。该模型采用 30B-A3B 混合专家架构,内置视觉和音频编码器,无需额外感知模块,使大规模推理效率提升九倍。Nemotron 3 Nano Omni 在复杂文档解析、视频与音频理解方面表现领先,已在六项国际权威榜单中名列前茅。英伟达表示,该模型能够快速处理全高清屏幕录像,显著增强智能体与数字环境的交互能力。目前已有多家企业基于该模型展开系统协作。Nemotron 3 系列的 Nano、Super、Ultra 版本过去一年累计下载量超过 5000 万次,显示市场对多模态 AI 技术的旺盛需求。