谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息
站长网2023-05-22 15:17:350阅
谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。
Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。
Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。
Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。
「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。
0000
评论列表
共(0)条相关推荐
Meta 即将发布商用版 LLaMA 大模型以追赶微软支持的 OpenAI 和谷歌等竞争对手
Meta即将发布其人工智能模型的商业版本,使初创企业和企业能够在该技术基础上构建定制软件。此举将使Meta能够与得到微软支持的OpenAI和谷歌竞争,后者正在AI赛道上快速发展生成式人工智能。站长网2023-07-14 09:50:340000麻省理工研究:利用AI帮助机器人让整个身体操纵物体
文章概要:1.新AI技术使机器人能够制定复杂的计划,利用整只手而不仅仅是指尖来操纵物体。2.该模型可以在大约一分钟内使用标准笔记本电脑生成有效的计划。3.尽管还处于初期阶段,但这种方法可能使工厂可以使用移动机器人来操纵物体,从而降低能源消耗和成本。站长网2023-08-25 17:23:260000法院:浏览记录既是用户个人信息也或是视频发布者个人信息
近日,北京互联网法院审结了张某诉A网络科技有限公司个人信息保护纠纷一案。法院认为,用户的浏览记录为个人在网络活动中的行为记录,既是用户的个人信息也可能涉及视频发布者的个人信息,在保护个人信息的同时也应遵循诚实信用原则。站长网2023-04-24 08:55:520000蜜雪冰城回应涨价1元尚未全国推广:部分区域试行
近日,网络上流传出上海地区蜜雪冰城饮品涨价的消息,声称每杯饮品价格上调了1元。针对此事,3月18日,蜜雪冰城总部客服人员确认,涨价情况确实存在,但这次调价目前仅限于上海的部分区域,作为一次试行措施。蜜雪冰城总部热线客服进一步解释说,自3月16日起,上海地区的普陀区、静安区、虹口区等七个区域开始试行涨价,根据新的定价方案,饮品价格确实上调了1元。站长网2024-03-19 10:01:460000