DeepSeek于5月9日大幅放开其“识图模式”的访问权限,标志着该公司正式进入图文多模态交互的内测阶段。该功能已集成至对话界面,与“快速模式”、“专家模式”并列,成为其核心产品矩阵的关键组成部分。DeepSeek的识图功能超越了传统的OCR文字提取,具备深度图片识别与语义理解能力,可对视觉信息进行逻辑拆解和情境感知,支持用户通过上传图片实现复杂的跨媒介交互。此举填补了DeepSeek在多模态理解领域的空白,使其在追赶GPT-4o等国际顶尖模型的进程中取得实质性进展。行业分析认为,这反映了国产大模型竞争重心正从单一文本生成转向全感官的“视觉语言耦合”。随着识图功能的全面铺开,DeepSeek有望在自动化办公、工业视觉理解及复杂图表分析等垂直领域释放更大生产力,加速国内大模型市场进入多模态能力普惠的新阶段。