谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息
站长网2023-05-22 15:17:350阅
谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。

Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。
Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。
Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。
「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。
0000
评论列表
共(0)条相关推荐
微软携手风险投资公司,为初创企业提供免费AI芯片资源
划重点:-微软计划与风险投资公司合作,为初创企业提供免费的Azure基础设施,用于训练人工智能模型。-该计划首先针对YCombinator和M12等初创企业提供NvidiaGPU虚拟机集群,以训练和运行生成模型。-微软希望通过此举降低初创企业训练和运行AI模型的门槛,同时推动Azure云平台的使用。站长网2023-11-08 16:58:020000辟谣:蝙蝠携带病毒却不生病,仅仅是体温高那么简单?
蝙蝠体内携带有众多对人类非常危险的病毒,包括埃德拉病毒、马尔堡病毒、亨德拉病毒、尼帕病毒和中东呼吸综合征冠状病毒等,这些病毒的流行曾导致大量人死亡,然而蝙蝠自己却从不因此生病,这是为什么呢?站长网2023-05-23 15:35:120000OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
OpenAI、斯坦福大学的研究人员推出了一个创新大模型增强框架——Meta-ProMetating(简称“Meta”)。Meta可增强GPT-4、PaLM和LLaMa等模型的性能,使生成的内容更加精准、安全可靠。其技术原理也很简单明确,通过将模型复杂的任务或问题分解为更小、可管理的子任务,并将其分配给功能更强的专家模型来进行指导。站长网2024-02-26 08:58:480000麒麟合盛APUS旗下AiLMe天燕大模型开放公测
麒麟合盛网络技术股份有限公司(APUS)发布的自研多模态人工智能大模型AiLMe(天燕大模型)开放公测。据悉,“AiLMe”于4月18日正式发布,AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。站长网2023-06-08 07:06:200000苹果对 iPhone15 系列信心十足 下半年出货量或达 8400 万台
站长之家(ChinaZ.com)7月12日消息:据供应链消息,业内人士预估,苹果将于8月开始批量生产iPhone15系列手机,预计下半年出货量将达8400万台,对比去年iPhone14系列增长12%。站长网2023-07-12 15:39:590000