IBM发布轻量级视觉语言模型Granite 4.0 3B Vision,优化企业文档数据提取

IBM近日推出全新视觉语言模型Granite 4.0 3B Vision,具备约30亿参数,专为企业级复杂文档的数据提取任务优化。该模型可高效处理含表格、扫描件及多模态布局的文档,通过结合视觉理解与语言生成技术,精准识别并结构化文档信息,显著提升金融、法律、医疗等行业的数据处理效率。采用轻量化架构设计,Granite 4.0 3B Vision可在云端与边缘设备灵活部署,降低算力与硬件成本。在多项文档智能基准测试中,该模型在复杂指令理解与图表解析准确率方面表现领先。IBM已将模型及开发工具开放至开源社区,方便开发者依据行业需求定制化微调,加速企业自动化与生成式AI在垂直领域的落地。

上一篇:

下一篇:

发表回复

登录后才能评论