谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息
站长网2023-05-22 15:17:350阅
谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。

Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。
Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。
Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。
「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。
0000
评论列表
共(0)条相关推荐
AI已学会上网点外卖!HyperWrite发布AI智能体 可自主浏览网页并付款
又进阶!AI已经学会点外卖了!最近,外国小哥的创业公司HyperWrite,发布了一个尚处实验阶段的AI智能体。网站地址:https://www.hyperwriteai.com/HyperWrite的AI助手在设计上非常人性化,可以像人一样操作浏览器。它可以浏览网站,与网站互动,并完成基本的在线任务,如订购比萨饼。甚至,这个AI还能自行查找地址,填写邮编,付钱完成订单。站长网2023-04-19 16:15:280000苹果称iPhone保值率超安卓至少40%
站长之家(ChinaZ.com)6月27日消息:在今日发布的一份白皮书中,苹果详细阐述了其产品的保值率优势。该公司指出,与安卓手机相比,iPhone的保值率显著领先,至少高出40%。更值得一提的是,随着机型的老化,旧款iPhone与同期安卓机型在保值率上的差距愈发明显。站长网2024-06-27 14:09:310001Windows最新份额公布:最低的不是XP
快科技2月8日消息,近日,StatCounter公布了1月份Windows全球市场份额的分布情况。其中,Windows10以66.47%的份额排名第一,份额最低的并非生命期最长的WindowsXP。具体来看,1月份,Windows10的份额来到66.45%,比去年12月份67.42%微降。Windows11则由去年12月份的26.54%提升到27.83%。二者合计份额达到了94.28%。站长网2024-02-08 15:42:290000代码托管平台 GitLab 推出 AI 驱动的排查代码漏洞功能
代码托管平台GitLab宣布推出一个新的安全功能,将使用人工智能(AI)向开发人员解释编码漏洞。该公司的目标是在未来利用大型语言模型(LLMs)自动化漏洞排查。站长网2023-04-26 11:00:360000DevOpsGPT: AI自动完成软件开发 提高开发效率
DevOpsGPT是一个基于人工智能的软件开发自动化解决方案,将自然语言需求转化为可工作的软件。通过结合LLM(大型语言模型)和DevOps工具,DevOpsGPT极大地提高了开发效率,缩短了开发周期,并降低了沟通成本,从而实现了更高质量的软件交付。项目地址:https://github.com/kuafuai/DevOpsGPT核心功能:站长网2023-08-04 10:19:550000