DeepSeek全面开放识图模式内测，正式跨入多模态交互时代

DeepSeek于5月9日大幅放开其“识图模式”的访问权限，标志着该公司正式进入图文多模态交互的内测阶段。该功能已集成至对话界面，与“快速模式”、“专家模式”并列，成为其核心产品矩阵的关键组成部分。DeepSeek的识图功能超越了传统的OCR文字提取，具备深度图片识别与语义理解能力，可对视觉信息进行逻辑拆解和情境感知，支持用户通过上传图片实现复杂的跨媒介交互。此举填补了DeepSeek在多模态理解领域的空白，使其在追赶GPT-4o等国际顶尖模型的进程中取得实质性进展。行业分析认为，这反映了国产大模型竞争重心正从单一文本生成转向全感官的“视觉语言耦合”。随着识图功能的全面铺开，DeepSeek有望在自动化办公、工业视觉理解及复杂图表分析等垂直领域释放更大生产力，加速国内大模型市场进入多模态能力普惠的新阶段。

DeepSeek全面开放识图模式内测，正式跨入多模态交互时代

发表回复