OneChart:仅2亿参数,专门用于图表信息结构化提取
划重点:
🔍 提出了一种新的工具 OneChart,旨在解决图表结构提取中的挑战。
📊 引入了一种辅助标记,通过它提升了数值部分的文本输出。
🏆 OneChart 在图表结构提取任务中取得了最先进的性能表现。
在图表解析领域,由于样式、数值、文本等的多样性,存在着重大挑战。即使是拥有数十亿参数的先进大型视觉 - 语言模型(LVLMs)也难以令人满意地处理此类任务。
为了解决这一问题,研究团队提出了一种可靠的工具 OneChart,专门用于图表的结构提取。它捕获了图表标题、来源和对齐的数值数据等重要组成部分,并将它们输出为 Python 字典格式,可以有效地促进下游图表推理任务。

为了增强文本输出中的数值部分,研究团队引入了一个辅助标记以及一个额外的解码器。这个辅助标记允许后续的文本标记通过因果关注来捕获增强的数值特征。此外,借助一个辅助标记,他们设计了一个可靠的检查机制,在推断过程中通过提供生成内容的自一致性距离来确保输出的可信度。
此外,研究团队还提出了一个大规模的图表转换为字典的基准测试。这些图表涵盖了广泛的主题和类型,并包括英语和中文内容。实验证明,尽管只有2亿 参数,OneChart 在结构提取方面实现了最先进的性能。在缺乏数值标注的图表中,与次优方法相比,其平均精度(AP)提高了19.1% ~29.4%。作为图表解析代理,它还为下游的 ChartQA 基准测试带来了11.2% 的准确率增益,对于 LLaVA-1.6和 LLaVA-1.5分别提高了32.6% 和11.2%。
在传统的图表问答基准测试中,通常局限于从图表中查询小的、孤立的信息片段,例如单个数值,这可能无法有效地衡量模型提取和理解图表中呈现的全部数据的能力。相比之下,OneChart 旨在建立一个以结构提取(SE)任务为中心的基准测试,直接评估模型将图表图像转换为结构化 Python 字典表示的准确性。它包括五个数据集部分,其中一个是 ChartY-zh(2,048个样本),其他是 ChartQA-SE(1,509个样本)、PlotQA-SE(33,657个样本)、ChartX-SE(2,360个样本)、ChartY-en(4,000个样本)。

研究团队提出的 OneChart 在图表结构提取方面取得了令人瞩目的成绩,为解决图表解析中的挑战提供了新的思路和方法。
产品入口:https://top.aibase.com/tool/onechart
华为nova 13 Pro正式发布:首发6000万像素全焦段人像 售价3699元起
快科技10月22日消息,今日晚间,华为nova13Pro正式发布。售价方面,256GB售价3699元,512GB售价3999元,1TB售价4499元。先来看一下nova13Pro的详细配置,这款新机采用6.76英寸全新动态臻彩屏,分辨率为27761224,支持1-120HzLTPO动态自适应刷新率。0000亚马逊加强监管Kindle出版商作品AI生成内容 必须披露AI生成部分
文章概要:1.亚马逊要求KindleDirectPublishing用户披露是否使用人工智能生成内容。2.更新指南要求披露AI生成的文本、图像和翻译。3.亚马逊采取行动,应对用户投诉,以减少AI生成内容的滥用。站长网2023-09-20 18:00:270000高通骁龙8 Gen4处理器即将发布 高通骁龙峰会定档
站长之家(ChinaZ.com)6月13日消息:骁龙峰会宣布将于今年10月21日至23日在风景如画的夏威夷毛伊岛隆重举行。此次峰会的一大亮点,无疑是即将正式亮相的高通最新移动平台——骁龙8Gen4。站长网2024-06-14 00:28:440000小鹏P7i推出优惠购车政策 限时0息最高可省2.4万元
小鹏汽车宣布,在即日起至9月30日期间,针对全新P7i全系车型推出限时购车优惠政策。消费者可以享受24期0息或10000元尾款减免的优惠方案,同时还可以免费升级价值6000元的丹拿Confidence系列原装音响。其中,610四驱MAX版本:首付最低2.9W起,24期0息最高可省1.8W,限时赠送价值6000元丹拿Confidence系列原装音响站长网2023-09-01 11:28:190000新加坡发布管理用个人数据训练AI模型的指南草案
新加坡发布了关于如何管理个人数据用于训练人工智能(AI)模型和系统的指南草案。该指南旨在解释企业使用个人数据训练AI模型和系统时新加坡法律的适用情况,包括研究和业务改进的例外情况。该指南强调了数据的准确性和透明性,并鼓励企业在训练AI模型时使用自己的数据,以确保数据的真实性和相关性。这样做可以提供更多的上下文信息,并减轻与准确性和知识产权侵权等潜在风险相关的担忧。站长网2023-07-20 19:04:370003