机器学习工具Magi:自动为漫画生成文本 帮助视障读者更容易地阅读漫画
划重点:
⭐️ 研究团队在牛津大学开发了名为 Magi 的先进工具,可以帮助视障读者更容易地阅读漫画。
⭐️ Magi 的方法包括智能地识别漫画页面上的面板、人物和文字块。
⭐️ 这项研究不仅突破了漫画可访问性的障碍,还展示了人工智能在提高可访问性方面的潜力。
在讲故事方面,日本漫画,即漫画,在全球范围内赢得了巨大的市场,以其复杂的情节和独特的艺术风格吸引着观众的注意。尽管它们具有全球吸引力,但一个重要的潜在读者群体却被忽视了:视障人士。对于他们来说,漫画的视觉中心性创造了一个无法访问的领域,尽管漫画中有丰富的叙事。

当前漫画之所以难以访问,主要挑战在于将视觉丰富的内容转化为视障人士可访问的格式。早期的漫画在很大程度上依赖于交织的视觉元素和文字,使体验固有地具有视觉性。这种视觉依赖意味着视障人士通常无法参与漫画艺术家创造的故事、人物和世界。
目前使漫画可访问的解决方案远非理想,主要是因为它们依赖于手动转录或音频描述,这种方法劳动密集且难以有效扩展。这种差距突出了需要更有效的自动化方法来使所有观众都能够欣赏漫画,无论其视觉能力如何。
牛津大学的研究团队开发了一种先进工具,名为 Magi,这标志着使漫画对视障读者更具可访问性的突破。Magi 是一个打开以往因视觉障碍而锁定的故事的通道,为所有读者提供了新的参与水平。
Magi 的方法包括智能地识别漫画页面上的面板、人物和文字块,以及将对话与其相应的讲话者相关联,保持叙事的完整性。通过严格测试,Magi 展示了在检测和聚类人物以及将文本与正确的讲话者相关联方面的优越能力,超越了现有方法。这种效率展示了该工具的精确性,以及它改变漫画阅读为一种所有视障人士都可以享受的包容性活动的潜力。
这项研究和开发工作突显了辅助技术方面的重大进展。通过利用复杂的算法和机器学习,Magi 为无法看到的人打开了一个以前无法访问的漫画世界。这一创新的影响超越了漫画,它为技术如何弥合娱乐领域的鸿沟树立了一个先例,使其普遍可访问。
开发 Magi 有助于使文化和娱乐内容的获取更加民主化。它突显了向包容性转变的趋势,打破了享受乐趣的障碍,使故事变得普遍可访问。这项研究不仅突显了人工智能在提高可访问性方面的潜力,还号召进一步在这一领域进行创新。随着技术的发展,希望更多的大门会打开,让每个人无论身体上的限制如何,都能探索广阔多样的娱乐和文化景观。Magi 从概念到实施的历程揭示了通往一个更加包容的世界的道路,让故事的乐趣无限延伸。
产品入口:https://top.aibase.com/tool/magi
论文:https://arxiv.org/abs/2401.10224v1
这些「黑话」,产品经理搞懂后少吃亏
产品经理在实际工作中经常会遇到一些“技术黑话”,这些专业术语经常让非技术背景的产品经理们经常不知所云,非常难受。因此,也带来了很多沟通和理解的问题。我之前梳理了一些以通俗的方式来理解“黑话”的方法,这里拿出来再分享下,希望对于非技术背景的产品经理们有所帮助。1、程序员口中的“写死”是什么意思?站长网2023-05-30 18:05:390000微软高管透露将推出更多超越OpenAI的大语言模型
**划重点:**1.🌐微软高管EricBoyd在采访中透露,公司计划推出更多超越OpenAI的大语言模型(LLMs),以满足客户对选择的需求。2.🚀Boyd表示,微软的生成式AI应用及其驱动这些应用的LLMs是安全可用的,但他强调,专注于文本生成等领域的公司能够更快地推进。00005款免费可用的3D建模AI工具!一键出片神器集合
AIGC已在文字、图像领域大放异彩,在3D内容领域最近也有了新进展。由于3D内容包含的信息更复杂,创建一个3D模型涉及美术、建模、动画制作、编程等多种能力,专业人士可能需要花费数天时间、上万元才能完成。站长网2023-08-14 14:24:240006京东推出20年回忆录活动 查消费金额即可领红包
今年是京东创业的第20周年,今日,京东官方宣布推出20年回忆录活动,只需在京东APP搜索#20年回忆录#,即可查询这些年来的消费总额等数据。值得一提的是,在回忆录的最后,京东还为消费者准备了惊喜,点击即可获得红包等礼物。站长网2023-05-22 14:20:230002百度推出基于大模型的代码编写助手Comate
据科创板日报报道,百度智能云在成都举行的文心大模型技术交流会上,正式发布了基于大模型打造的新一代编码辅助工具“Comate”代码助手,并已经开放邀测。百度表示,已经在百度内部进行了大量测试,测试结果显示,在“Comate”辅助编写的代码中,近50%的建议代码被开发者采纳。站长网2023-06-07 19:12:170000