杭州萌嘉网络科技申请基于开源组件的文档解析方法专利,显著提升向量检索相关性及LLM知识理解准确性
创始人
2026-02-12 21:49:24

国家知识产权局信息显示,杭州萌嘉网络科技有限公司申请一项名为“一种基于开源组件的文档解析方法、系统及其存储介质”的专利,公开号CN121503433A,申请日期为2025年10月。

专利摘要显示,本发明公开了一种基于开源组件的文档解析方法、系统及其存储介质,涉及文档处理技术领域,包括对接收的原始文件通过基于文件魔数与文件扩展名的双重检测机制来判断文件格式,根据所述文件格式选择并执行差异化的解析流程,以获得结构化的表格数据与非表格内容数据,再将两部分数据进行融合形成最终文档,对文件解析后的文档进行结构化优化,以生成一个便于向量化分割和语义检索的优化输出内容,通过智能格式检测与差异化解析技术,精准还原文档的复杂表格结构与合并单元格,采用占位符融合机制与RAG专用优化,输出兼具标准化标题与保持结构语义的混合格式,显著提升向量检索相关性及LLM知识理解准确性。

天眼查资料显示,杭州萌嘉网络科技有限公司,成立于2020年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本500万人民币。通过天眼查大数据分析,杭州萌嘉网络科技有限公司专利信息1条。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

相关内容

热门资讯

明日题材前瞻:智谱AI套餐售罄... ①智谱GLM Coding Plan上线即售罄,国产AI编程模型需求强劲 2月12日,智谱官方GLM...
恒生科技投资者,错失AI大时代... 文 | 港股研究社 2025年,港股迎来AI驱动的科技牛市。恒生指数全年上涨27.7%,但一个反直...
森霸传感:目前在AI智能上尚无... 证券之星消息,森霸传感(300701)02月11日在投资者关系平台上答复投资者关心的问题。 投资者提...
“AI付”加速进入普及快车道 ... 封面新闻记者 张越熙 2月12日,支付宝宣布“AI 付”一周累计支付笔数已超1.2 亿笔,成为全球首...