国家知识产权局信息显示,杭州萌嘉网络科技有限公司申请一项名为“一种基于开源组件的文档解析方法、系统及其存储介质”的专利,公开号CN121503433A,申请日期为2025年10月。
专利摘要显示,本发明公开了一种基于开源组件的文档解析方法、系统及其存储介质,涉及文档处理技术领域,包括对接收的原始文件通过基于文件魔数与文件扩展名的双重检测机制来判断文件格式,根据所述文件格式选择并执行差异化的解析流程,以获得结构化的表格数据与非表格内容数据,再将两部分数据进行融合形成最终文档,对文件解析后的文档进行结构化优化,以生成一个便于向量化分割和语义检索的优化输出内容,通过智能格式检测与差异化解析技术,精准还原文档的复杂表格结构与合并单元格,采用占位符融合机制与RAG专用优化,输出兼具标准化标题与保持结构语义的混合格式,显著提升向量检索相关性及LLM知识理解准确性。
天眼查资料显示,杭州萌嘉网络科技有限公司,成立于2020年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本500万人民币。通过天眼查大数据分析,杭州萌嘉网络科技有限公司专利信息1条。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯