DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
创始人
2025-10-21 11:20:21
0

10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

【来源:快科技】

相关内容

热门资讯

赛维时代新设子公司,含多项AI... 企查查APP显示,近日,深圳市智创云图科技有限公司成立,注册资本1000万元,经营范围包含:人工智能...
赛维时代新设子公司 含多项AI... 每经AI快讯,天眼查显示,近日,深圳市智创云图科技有限公司成立,注册资本1000万元,经营范围包含:...
优必选等新设科技公司,含多项A... 企查查APP显示,近日,优谱汇智(北京)科技有限公司成立,注册资本1200万元,经营范围包含:人工智...
大象新闻×网宿边缘AI:战略携... 随着媒体融合向纵深发展迈进,人工智能技术成为驱动这一变革的核心引擎。近日,河南广播电视台旗下的省级融...
微软官宣:Win11彻底转向A... 10月21日,据科技媒体Windows Latest报道,微软正式明确了Windows 11的未来进...
北京人形创新中心开源 WoW,... 今日截至10点08分,机器人ETF(562500)上涨0.81%,涨幅位居同类ETF第一,走势略强于...
Unbox The Futur... 作为 2025 进博会上海会议活动的延展环节,「华兴资本」将携手「观猹」共同推出「 AI 创业者 D...
DeepSeek开源3B OC... 10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSee...
从收藏卡牌到AI智能体,杰森娱... 2025年,IP潮玩经济持续升温,消费者尤其青睐能提供情绪价值、具备收藏和社交属性的IP衍生品,市场...
AI医疗,能否轻易托付? 然而,一个值得思考的问题也随之而来:当已经成为人类健康“先知”的AI开始参与“决定生死”,我们能否将...