金融界2024年9月1日訊息,天眼查智慧財產權資訊顯示,廣州視源電子科技股份有限公司申請一項名為「文件解析方法、裝置及電子裝置「,公開號 CN202310187028.X,申請日期為2023年2月。
專利摘要顯示,本申請公開了一種文件解析方法、裝置及電子裝置。該方法透過獲取的待解析的文件提取文本資訊和文本布局資訊;提取待解析的文件的視覺資訊;獲取文本資訊和文本布局資訊對應的特征資訊,並獲取視覺資訊對應的特征資訊;將文本資訊和文本布局資訊對應的特征資訊,以及視覺資訊對應的特征資訊進行融合,獲得目標融合資訊;根據目標融合資訊,獲取待解析文件的解析結果。本申請提供了一種端到端的文件解析方法,能夠避免相關技術中兩階段方法中各個資源模組相互依賴、相互影響、難以維護的問題;另外,透過包含了文本資訊、文本布局資訊以及視覺資訊的目標融合資訊來獲得文件的解析結果,由此豐富了特征資訊,提高了解析結果的準確率。