金融界2024年9月1日消息,天眼查知识产权信息显示,广州视源电子科技股份有限公司申请一项名为「文档解析方法、装置及电子设备「,公开号 CN202310187028.X,申请日期为2023年2月。
专利摘要显示,本申请公开了一种文档解析方法、装置及电子设备。该方法通过获取的待解析的文档提取文本信息和文本布局信息;提取待解析的文档的视觉信息;获取文本信息和文本布局信息对应的特征信息,并获取视觉信息对应的特征信息;将文本信息和文本布局信息对应的特征信息,以及视觉信息对应的特征信息进行融合,获得目标融合信息;根据目标融合信息,获取待解析文档的解析结果。本申请提供了一种端到端的文档解析方法,能够避免相关技术中两阶段方法中各个资源模块相互依赖、相互影响、难以维护的问题;另外,通过包含了文本信息、文本布局信息以及视觉信息的目标融合信息来获得文档的解析结果,由此丰富了特征信息,提高了解析结果的准确率。