谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息
站长网2023-05-22 15:17:350阅
谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。
Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。
Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。
事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。
Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。
「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。
0000
评论列表
共(0)条相关推荐
德国、法国和意大利就未来人工智能监管达成协议
根据路透社看到的一份联合文件,法国、德国和意大利已就如何监管人工智能(AI)达成协议,预计将加速欧洲层面的谈判进程。这三个政府支持对所谓的AI基础模型实施「强制性自我监管」,通过行为准则来进行。这些模型旨在产生广泛的输出,但他们反对「未经测试的规范」。「我们共同强调,AI法案规范的是AI的应用,而不是技术本身,」联合文件中说。「固有风险在于AI系统的应用,而不在于技术本身。」站长网2023-11-20 09:35:400000国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
【新智元导读】大模型混战究竟谁才是实力选手?清华对国内外14个LLM做了最全面的综合能力测评,其中GPT-4、Cluade3是当之无愧的王牌,而在国内GLM-4、文心4.0已然闯入了第一梯队。在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。站长网2024-04-19 18:24:330000Perplexity热度爆表,单月搜索量达2.5亿是去年一半,AI搜索让谷歌掉队?
【新智元导读】AI搜索需求市场广阔,Perplexity搜索在上个月回答了大约2.5亿个问题,预期收入猛增7倍。最近,人工智能搜索引擎市场持续「升温」。一方面,市占率90%以上的搜索界「一哥」谷歌正在将Gemini集成到搜索引擎中;另一方面,OpenAI也要来AI搜索市场分一杯羹,推出了SearchGPT。站长网2024-08-16 16:29:590000大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
人工智能的反馈(AIF)要代替RLHF了?大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。最近,来自Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。站长网2024-01-21 11:06:230000马斯克旗下脑机公司Neuralin启动首次人体试验 招募四肢瘫痪和ALS患者
据彭博社报道,亿万富翁伊隆·马斯克领导的大脑植入创业公司神经链接(Neuralink),正在招募四肢瘫痪和肌萎缩性脊髓侧索硬化(ALS)患者,参与该公司的首次人体临床试验。这标志着这项仿佛科幻的技术更进一步地接近人体应用现实。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-09-20 09:43:320000