英伟达发布多模态模型 Nemotron 3 Nano Omni，智能体推理效率提升九倍

英伟达推出新一代开放式多模态模型 Nemotron 3 Nano Omni，将视频、音频、图像与文本推理整合于同一系统。该模型采用 30B-A3B 混合专家架构，内置视觉和音频编码器，无需额外感知模块，使大规模推理效率提升九倍。Nemotron 3 Nano Omni 在复杂文档解析、视频与音频理解方面表现领先，已在六项国际权威榜单中名列前茅。英伟达表示，该模型能够快速处理全高清屏幕录像，显著增强智能体与数字环境的交互能力。目前已有多家企业基于该模型展开系统协作。Nemotron 3 系列的 Nano、Super、Ultra 版本过去一年累计下载量超过 5000 万次，显示市场对多模态 AI 技术的旺盛需求。

英伟达发布多模态模型 Nemotron 3 Nano Omni，智能体推理效率提升九倍

发表回复