谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息
站长网2023-05-22 15:17:350阅
谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。
Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。
Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。
Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。
「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。
0000
评论列表
共(0)条相关推荐
Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印
**划重点:**1.🌐Meta的研究人员开发了一种方法,在人工智能生成的语音中隐形水印,可用于主动检测AI生成的言论,识别生成它的模型。2.🚀FacebookResearch提出的AudioSeal技术通过水印标记AI生成的语音,以解决对抗合成语音的检测问题,具有高精度和鲁棒性。站长网2024-02-04 14:58:380000分析师警告,AI 热潮将导致高端内存芯片供应紧张
划重点:-高性能内存芯片供应将在今年保持紧张,因为爆炸性的人工智能需求推动了这些芯片的短缺。-世界上两家最大的内存芯片供应商SKHynix和Micron表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。-AI芯片需求的增长推动了高端内存芯片市场的增长,对三星电子和SKHynix等顶级内存芯片制造商带来了巨大利益。站长网2024-05-14 11:44:090000Spotify CEO称将引入多个AI技术的新功能
在第二季度财报电话会议上,Spotify的首席执行官DanielEk透露了该流媒体服务可能引入额外的AI功能的几种方式。Ek谈到了AI如何用于创建更个性化的体验,总结播客和生成广告。站长网2023-07-26 14:05:180000?签约OR孵化,MCN机构该如何平衡商业效率?
在刚刚过去的4月,由克劳锐出品的《2023中国内容机构(MCN)行业发展研究白皮书》重磅发布,白皮书在引发业内热议的同时也为中国MCN机构的发展给出了可能的方向。在白皮书发布后,克劳锐以“实现增长,路在何方”为主题发起系列直播,通过对话MCN机构创始人,探讨MCN机构们当前关注的重点行业问题。0000荣耀200官宣5月27日发布:真机外观正式揭晓
快科技5月17日消息,今早荣耀正式发文官宣新机荣耀200系列。该机将于5月27日正式发布,官方还直接公布了新机的外观。画面中可以看到,荣耀200系列背部延续了前代上辨识度非常高的新艺术之镜”后摄模组。灵感源自新艺术风格运用的颠峰之作一一高迪的代表建筑米拉之家”,中心对称的天井之窗设计形态,创造出自然自由主义”的浪漫之美。站长网2024-05-17 10:09:060000