近日,2024中国图象图形大会在古都西安盛大开幕。本次大会不仅汇集了业界精英,更聚焦了大模型技术的前沿应用,特别是智能文档处理技术的突破与创新,引发了广泛关注。
随着大模型技术的广泛应用,其在多行业图像处理中展现出巨大潜力。然而,大模型技术的飞速发展也面临着一场“能源危机”——高质量训练语料的稀缺。据Epoch研究小组估计,机器学习数据集可能在不久的将来耗尽所有“高质量语言数据”。面对这一挑战,文档解析技术的进步成为了关键。
(行业关注者聆听《大模型技术及其前沿应用》论坛分享)
大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司联合主办的《大模型技术及其前沿应用》论坛,成为与会者关注的焦点。论坛上,合合信息智能创新事业部研发总监常扬分享了公司在文档解析领域的最新成果,为业界带来了新思路。
常扬指出,文档解析的难点在于准确识别文档中的各个元素,并理解其之间的逻辑关系。这包括物理版面分析和逻辑版面分析两个方面。物理版面分析侧重于视觉特征和文档布局,而逻辑版面分析则侧重于语义特征的分析。通过这两项分析,机器能够更好地处理文本、表格、图像等多类型数据,还原文档阅读顺序,从而加速大模型的训练与应用。
合合信息通过十几年的技术积淀,已经打通了电子档解析、扫描档图像处理、文字识别、表格识别、版面分析、版面还原和排版布局等文档智能化处理的全流程。这一技术突破不仅为大模型领域提供了精准的训练语料与文档问答应用体验,也为各行各业带来了实质性的便利。
“真实世界的文档布局类型极为丰富,无法用简单的分类来定义。”常扬表示,近年来开放词汇目标检测、视觉语义对齐等工作的进展,以及生成式模型等前沿技术,将为版面分析带来新的研究思路。合合信息将持续在智能文档处理领域深耕,推动新技术在行业中更快速地产生价值。
本次大会不仅为图像图形领域的专家学者提供了一个交流合作的平台,更展现了智能文档处理技术的巨大潜力和广阔前景。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,智能文档处理技术将在未来发挥更加重要的作用,推动各行各业实现数字化转型和智能化升级。