微软创新项目Project Rumi:多模态AI项目助力理解人类意图
站长网2023-08-07 09:57:510阅
Project Rumi 是微软的一个项目,旨在通过解决大型语言模型(LLM)理解非语言线索和上下文细微差别的局限性,增强 LLM 的能力。
该项目将非语言线索融入基于提示的 LLM 交互中,以提高交流的质量。研究人员使用音频和视频模型从数据流中检测实时的非语言线索。使用两个独立的模型分别从用户音频中提取声调和语音的语义信息。研究人员使用视觉转换器对视频进行编码,并从中识别面部表情。下游服务将非语言线索信息融入基于文本的提示中。这种多模态方法旨在增强用户情感和意图的理解,从而将人工智能与人类的互动提升到一个新的水平。
论文地址:https://www.microsoft.com/en-us/research/project/project-rumi/
未来,研究人员计划改进模型的效率,并添加更多细节,如从标准视频中获取的心率变异性(HRV)和认知和环境感知。这是在下一波与人工智能的交互中增加无言意义和意图的更大努力的一部分。
要点:
1. Project Rumi 旨在通过增加语言模型对非语言线索和语境细微差别的理解能力,提升大型语言模型的能力。
2. 该项目采用多模态方法,通过音频和视频模型检测实时的非语言线索,以提高与语言模型的交互质量。
3. 未来的研究计划包括进一步改进模型,并添加心率变异性和环境感知等更多细节,以实现与人工智能的更深层次的交互。
0000
评论列表
共(0)条相关推荐
专利纠纷持续发酵 苹果在美停售AppleWatch
近期,苹果与医疗科技公司Masimo之间的专利纠纷持续发酵,引发了广泛关注。据报道,ITC(美国国际贸易委员会)裁定苹果侵犯了Masimo的专利,这可能导致AppleWatchSeries9和AppleWatchUltra2在美国市场面临禁售的风险。0000三星发布 Galaxy Book 4 系列,配备英特尔全新人工智能芯片组
三星本月早些时候预告了GalaxyBook4系列,引起了对搭载Intel最新芯片组的AI驱动GalaxyBookPC的期待。GalaxyBook4系列正是这样的产品,将于本月推出。站长网2023-12-15 10:10:010000百度、腾讯、阿里等企业向英伟达订购50亿美元AI芯片
据英国金融时报消息,百度、腾讯、阿里巴巴和字节跳动四家公司合计向英伟达订购了价值50亿美元的AI芯片。其中,今年英伟达将发货约10万块A800芯片,价值10亿美元,另外价值40亿美元的芯片将在明年交付。站长网2023-08-10 09:44:090000国家金融监管总局:警惕AI新型技术诈骗风险
随着AI技术的广泛应用,一些不法分子也将其用于实施诈骗。近日,国家金融监督管理总局发布消费者权益保护风险提示,提醒广大公众警惕利用AI新型技术实施的两种诈骗手段“拟声”和“换脸”。“拟声”指利用AI技术合成他人声音,“换脸”是利用AI技术伪造他人脸部图像。这两种手段都可以制作出非常逼真的音频、视频和图片,用来冒充亲友或其他熟人,诱导受害人汇款或提供敏感信息。站长网2023-10-16 09:05:550000AI 律师助手:LexisNexis 引入生成式人工智能简化法律工作
文章概要:1.法律软件公司LexisNexis正引入AI技术,以简化法律文书撰写和研究工作。2.AI技术有望帮助律师更高效地进行法律工作,包括文书撰写和查找相关法律案例。3.公司的首席技术官表示,引入类似于ChatGPT的AI功能将改变法律行业的工作方式。LexisNexis是一家法律软件公司,主要提供工具帮助律师找到正确的判例法来进行法律论证。站长网2023-09-11 15:54:070000