1月27日,DeepSeek团队发布全新DeepSeek-OCR 2模型并开源,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式更接近人类的视觉编码逻辑。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。
编辑|程鹏杜波
校对|许绍航
封面图片来源:视觉中国(资料图)
每日经济新闻综合自每经AI快讯
每日经济新闻
上一篇:埃隆·马斯克写道,恭喜特朗普总统!这对世界来说是一项胜利,也是对世界各地邪恶独裁者的明确警告,马斯克转发了白宫和特朗普的推文
下一篇:DeepSeek发布新模型!开源DeepSeek-OCR 2模型,让AI更懂看图逻辑