OneChart:仅2亿参数,专门用于图表信息结构化提取
划重点:
🔍 提出了一种新的工具 OneChart,旨在解决图表结构提取中的挑战。
📊 引入了一种辅助标记,通过它提升了数值部分的文本输出。
🏆 OneChart 在图表结构提取任务中取得了最先进的性能表现。
在图表解析领域,由于样式、数值、文本等的多样性,存在着重大挑战。即使是拥有数十亿参数的先进大型视觉 - 语言模型(LVLMs)也难以令人满意地处理此类任务。
为了解决这一问题,研究团队提出了一种可靠的工具 OneChart,专门用于图表的结构提取。它捕获了图表标题、来源和对齐的数值数据等重要组成部分,并将它们输出为 Python 字典格式,可以有效地促进下游图表推理任务。

为了增强文本输出中的数值部分,研究团队引入了一个辅助标记以及一个额外的解码器。这个辅助标记允许后续的文本标记通过因果关注来捕获增强的数值特征。此外,借助一个辅助标记,他们设计了一个可靠的检查机制,在推断过程中通过提供生成内容的自一致性距离来确保输出的可信度。
此外,研究团队还提出了一个大规模的图表转换为字典的基准测试。这些图表涵盖了广泛的主题和类型,并包括英语和中文内容。实验证明,尽管只有2亿 参数,OneChart 在结构提取方面实现了最先进的性能。在缺乏数值标注的图表中,与次优方法相比,其平均精度(AP)提高了19.1% ~29.4%。作为图表解析代理,它还为下游的 ChartQA 基准测试带来了11.2% 的准确率增益,对于 LLaVA-1.6和 LLaVA-1.5分别提高了32.6% 和11.2%。
在传统的图表问答基准测试中,通常局限于从图表中查询小的、孤立的信息片段,例如单个数值,这可能无法有效地衡量模型提取和理解图表中呈现的全部数据的能力。相比之下,OneChart 旨在建立一个以结构提取(SE)任务为中心的基准测试,直接评估模型将图表图像转换为结构化 Python 字典表示的准确性。它包括五个数据集部分,其中一个是 ChartY-zh(2,048个样本),其他是 ChartQA-SE(1,509个样本)、PlotQA-SE(33,657个样本)、ChartX-SE(2,360个样本)、ChartY-en(4,000个样本)。

研究团队提出的 OneChart 在图表结构提取方面取得了令人瞩目的成绩,为解决图表解析中的挑战提供了新的思路和方法。
产品入口:https://top.aibase.com/tool/onechart
微软确认 Windows Copilot 并非所有人都能在 Windows 11 上使用
站长之家(ChinaZ.com)10月9日消息:WindowsCopilot是Windows11Moment4更新的一部分,于9月26日开始向普通用户推出。但并非所有人都可以使用Copilot。目前,Copilot仅在美国(以及北美)、英国以及亚洲和南美洲的一些国家可用。站长网2023-10-09 11:37:280000魅族 21 超前订突破 20 万 将于 11 月 30 日发布
魅族官方宣布,魅族21超前订用户数量已经突破了20万大关,所有超前订用户都将全量享受180天的以换代修服务。如果超前订用户数量突破25万,所有超前订用户将全量解锁半年的碎屏保障服务。魅族21一元超前订活动提供了36个月质保等N重权益,包括优先发货、以旧换新补贴,以及AR智能眼镜的999元权益包。站长网2023-11-20 14:02:030000在线教育出海掘金,攥紧AI
当国内的在线教育进入存量争夺后,不少教育科技类公司为寻求新增长,将目光望向了海外。然而教育不同于普通商品,面对历史、人文、政治、经济差异悬殊的海外市场,虽有着巨大潜力,但实现本土化运营并非易事。值得注意的是,由于全球化合作所衍生的“中文热”现象,海外市场在中文职业教育、高等教育以及K12教育上有着很明确的中文需求。落地是中文赛道的海外市场空间,能够通过ToB或ToG模式实现规模效益。站长网2024-05-09 23:07:210000火山语音推出AI多角色演播方案 实现角色自动配音
火山语音团队推出了“AI多角色演播方案”,该方案利用了火山语音内置的60多种音色矩阵,并借助NLP技术智能地理解文本内容,从而实现角色自动配音,达到与真人相媲美的多角色演播效果。站长网2023-07-06 16:33:390002OpenAI、谷歌、微软和 Anthropic联合成立机构监督“前沿人工智能”模型开发
为了响应日益增长的监管呼声,OpenAI、微软、谷歌和Anthropic成立了前沿模型论坛,旨在确保“前沿人工智能”模型的安全和负责任的开发。该联盟将利用成员公司的专业知识来开发技术评估和基准,并推广最佳实践和标准。他们认为这类模型对公共安全构成严重风险,具有独特的监管挑战。论坛的目标包括推进人工智能安全研究、确定最佳实践、与政策制定者合作,并支持应对社会挑战的应用程序。具体如下:站长网2023-07-27 12:02:250000