苹果Vision Pro头显AI助手来了 会调酒还会打麻将
站长网2023-06-12 17:12:550阅
上周苹果推出的Vision Pro头戴显示器引起了很多人的兴趣。你能想象一下如果加上人工智能的话,会是什么样的体验吗?
最近,新加坡南洋理工大学和微软雷蒙研究所推出了一个多模态的人工智能助手——Otter(水獭)。它能够以视频作为输入,完成多模态的感知、推理和上下文学习,并经过专门的指令遵守训练。

它不仅能够教你打麻将、开飞机,还能教你调酒。它能够实时识别现实场景并回答人类提问,简直是一个全能型的选手。
Otter支持8种语言,包括中文。在训练过程中,团队使用了适用于增强现实头戴显示器的第一人称视角视频,明确表示这是为苹果头戴显示器准备的。有网友发现,在各种测试项目中,Otter的平均成绩比传统的MiniGPT-4、OpenFlamingo等传统模型高出了十几个百分点。

Otter使用视觉识别模块来分析场景信息,并结合ChatGPT生成答案。其中,关键的视觉模块是基于改良版的LLaVA进行训练的。Otter的工作流程大概是这样的:首先要对视觉信息进行处理,并结合系统信息生成激励。生成好的激励会被传递给ChatGPT,得到指令-回应数据。这些回应数据再经过一步筛选器的筛选,由ChatGPT将所选择的语言进行翻译并输出。此外,团队还引入了冷启动机制,用于发现可用于数据库中的情景实例。
在线体验:
https://otter.cliangyu.com/
论文地址:
https://arxiv.org/abs/2306.05425
GitHub页面:
https://github.com/Luodian/Otter
0000
评论列表
共(0)条相关推荐
主播被判赔公会3000万背后:除了违约,还是转型失败的案例?
又一起主播与机构之间的纠纷!近日,据企查查,主播庄某成了失信被执行人,关联司法案件为新沂顺图网络科技有限公司(时光公会的主体公司)与其网络服务合同纠纷。其中,庄某被判向时光公会支付各项费用共计3000万元。据司法公开信息显示,“庄某”全名为庄严。在行业内名极一时的老牌头部主播MC九局(以下称“九局”),据公开资料显示,其真名就是庄严。站长网2023-05-31 09:34:520000AI美女带货月入7w+,数字人主播路子有点野!
2023年起,AI成为街头巷尾的热议话题,各类相关话题更是频频登上热搜。近期,台湾音乐人包小柏利用AI技术在数字世界“复活”去世的女儿,实现互动。两会期间,以总台央视主持人郭若天、孟湛东为原型“复刻”的两位AI主播“上岗”,在央视财经新媒体24小时为用户解答经济、产业、旅游等领域问题。图片来自网络另外,在各大电商平台,AI主播们早就纷纷“上岗”带货了。站长网2024-03-20 10:17:290000AI 技术推动用户积极部署边缘数据中心 2027 年市场将达 111 亿美元
据IDC日前公布的数据显示,2023年上半年,中国SDS(软件定义存储市场)市场同比增长7.7%,未来五年,中国「软件所定义的市场」将以8.3%的复合年增长率增长;2027年市场容量预计接近38亿美元。站长网2023-10-18 21:20:090000欧盟将要求所有手持设备均可更换电池 包括Switch掌机
欧洲议会成员上个月通过了欧盟电池指令的修订后,理事会于7月13日(星期一)批准了该法规。根据欧盟的说法,经过本周的批准,电池法规现在将由理事会和欧洲议会签署,并在欧盟的官方刊物上公布,它将在公布后20天内生效。更新规则引入的关键变化之一是关于电池回收的正式目标。该法规为生产商设定了收集废弃便携式电池的目标,到2027年底为63%,到2030年底为73%。站长网2023-07-18 00:04:300000谷歌推出桌面版Chrome“帮我写”功能 AI写作助手进一步强化
站长之家(ChinaZ.com)12月6日消息:近期,谷歌宣布将人工智能驱动的“帮我写”功能引入桌面版Chrome,为Windows、Mac和Linux用户提供更便捷的写作助手。这一功能已经在GoogleMessages、Gmail、Docs和Keep等应用中得到应用,现在进一步扩展至Chrome浏览器。站长网2023-12-06 11:34:240001