亚马逊生成式 AI 增强语音助手:通过 Alexa LLM 改善智能家居的大脑
站长之家(ChinaZ.com) 9月21日消息:亚马逊的 Alexa 即将迎来革命性变革,而其新面貌可能非常引人注目。在周三的秋季硬件发布活动中,该公司揭示了由其全新 Alexa 语言模型提供支持的全新 Alexa 语音助手。

根据亚马逊设备与服务部门的现任高级副总裁 Dave Limp 所说,这个新的 Alexa 能够理解对话短语并做出恰当回应,更有效地解释上下文,并完成多个请求。
语音助手需要一场颠覆性的改革。缺乏创新和对理解能力几乎无法察觉的改进,使它们变成了基本工具,而不是我们在十多年前它们首次登场时所期望的令人兴奋的技术进步。
生成式人工智能似乎一直是它们进化的最佳机会。但是,虽然这些数字助手一直具备人工智能的元素,但它们缺乏生成式人工智能所具备的复杂处理能力和更类似人类的交互能力。这对智能家居来说是一个重要时刻,因为它可能将家庭自动化提升到一个新水平,使其从遥控体验转变为真正智能的家居。
在接受媒体采访时,Limp 解释称,新的 Alexa LLM「是一个真正的通用大型语言模型,非常针对 Alexa 的用例进行了优化;它与 Bard 或 ChatGPT 等不同。」
然而,这个全新的 Alexa 并不会立刻在所有地方、所有用户上全面推出。该公司计划通过一个「未来几个月内」的预览计划逐步推出,而且仅限于美国。显然,亚马逊从微软和谷歌的失误中吸取了教训,正在谨慎地进行推进。
Limp 表示:「当将 LLM 连接到现实世界时,您希望尽量减少幻觉——尽管我们认为我们已经准备妥当,但是没有什么能代替将其投放到真实世界。」如果您希望在预览中加入,只需告诉您的 Echo 设备,「Alexa,让我们聊聊」,您的兴趣将被登记。
毫不奇怪,这个功能强大的 Alexa 可能并不总是免费的。Limp 表示,虽然今天的 Alexa 将保持免费,但「一个超级人工助手的概念,可以让您的智能家居更加强大,能够代表您执行复杂任务,可能会提供足够的实用性,以至于未来我们可能会对其收费。」
新的 Alexa 的第一个重大变化将是更具对话能力的助手,可以更好地理解您所说的内容,无需过于具体的术语即可执行您的请求。这是声控助手最常见的令人沮丧的原因之一——当您要求它调低恒温器的温度时,不得不重复说明,或者当您只想找到遥控器的位置时,它却回应「有几个东西叫做『灯』。请选择唯一的名称并重新运行发现」,这样的回应已经出现了 900 次。而此时您只想查看遥控器放在哪里。
有了新的 Alexa,您可以说出短语,比如「Alexa,我冷了」,助手应该会调高您连接的恒温器的温度。或者,如 Limp 所解释的,「说,『Alexa,让这个房间感觉像 Seahawk 的颜色』,它将知道我在哪个房间,知道 Seahawk 的颜色,并在 API 之间进行翻译。」
Limp 说,关键在于 API。他说:「我们将大量的智能家居 API(200 多个)导入了我们的 LLM。」这些数据,结合 Alexa 对您家中设备和您所在房间的了解(根据您与之交谈的 Echo 音响),将为 Alexa 提供所需的上下文,以更主动、更无缝地管理您的智能家居。
这种上下文理解将扩展到知晓您可能想要控制的其他连接设备,以及推断何时发生了一些变化,例如在您的家中。Limp 解释说:「如果您在家中添加了新设备,您可以说『Alexa,打开新灯』,它会知道新灯是什么。它会消除歧义,所以如果您安装了新的智能插座或灯,它将更容易控制。」
另一个新功能是同时响应多个请求。这不仅仅是它以前已经能够做到的基本功能(在某种程度上),比如「Alexa,关灯并锁门」。这更加先进。Limp 说:「您可以说『Alexa,打开洒水器并打开我的车库门,然后关掉外面的灯』,它会弄清楚所有这些。」
最初,多重命令功能将仅适用于设备类型的子集,包括灯、智能插座等,Limp 表示。但该团队正在努力扩展其支持的设备类型。
这一功能将扩展到通过语音完全创建 Routines,而无需在 Alexa 应用程序中进行手动编程。Limp 说:「今天早上,我通过说『Alexa,每天早上 8 点,把灯打亮,为我的孩子在他的卧室播放唤醒音乐,然后启动咖啡机』来设置了一个 Routine。」他还补充说:「这可以变得非常复杂和模棱两可,但立即就会在您的应用中显示为 Routine。」
最初,多重命令功能将仅在一部分设备类型上工作,包括灯、智能插座等,Limp 表示。但该团队正在努力扩展其支持的设备类型。
这些变化将使 Alexa 成为更具沟通能力和上下文理解能力的助手,使其能够更灵活地满足用户的需求。同时,这也为智能家居带来了更高级的自动化水平,使用户能够更方便地控制和管理他们的智能设备。
不过,新的 Alexa 将首先在美国以预览计划的形式推出,而将来可能会考虑向其他地区扩展。
史上最贵“蹦迪票”!神秘买家8万拍下椰树直播间蹦迪权:1秒单价2698元
直播带货早已成为如今大大小小商家营销的主要方式,面对同质化的直播风格,椰树集团的直播方式熟悉”又新颖。日前,椰树集团入驻淘宝直播,直播首秀前,椰树在淘宝拍卖上上架直播间蹦迪权”,50元起拍,拍中的粉丝就能在直播间和椰树模特团共舞30秒。目前,这张蹦迪票”拍卖结果已经出炉,由一位神秘买家花80930的价格拍下,堪称史上最贵蹦迪票”。站长网2023-06-03 15:40:240000首款骁龙8至尊版旗舰!魏思琪:小米15明天预热
快科技10月23日消息,高通骁龙8至尊版发布后,已有多家手机厂商宣布自家旗舰新机的发布时间,而拿下骁龙8至尊版全球首发权的小米15,却仍未公布发布会时间。今日,小米手机市场部总经理魏思琪微博发布视频并称:今天有些过于忙碌了,明天见”。魏思琪在视频中透露,新产品很快要跟大家见面了,大家再稍等一下,对于大家催小米15系列赶紧预热,魏思琪表示:明天明天,咱们聊点官方不说的。”0000阿里影业完成收购大麦网全部股权
阿里影业在港交所发布公告,已于2023年11月30日完成收购大麦网。9月19日,阿里影业曾公告,计划收购经营“大麦”品牌的PonyMediaHoldingsInc.的全部股权。此次交易的总对价为1.67亿美元,约合13.07亿港元。0000Google的E3 TTS 通过扩散模型提供高质量音频合成方法
要点:1、E3TTS是一种简化高效的端到端扩散式文本到语音模型,通过扩散模型生成高保真的语音波形。2、E3TTS模型由预训练的BERT模型和扩散UNet模型组成,以提取文本信息并迭代地生成最终的语音波形。3、E3TTS不仅能生成高保真音频,还支持零样本任务,如语音编辑和基于提示的生成。站长网2023-11-07 14:14:270000AI视野:Hugging Face聊天助手上线;SVD的Web平台发放测试资格;AI模拟器“决战拜年之巅”走红;美图宣布2.85亿元收购站酷
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用HuggingFace聊天助手上线两步就能创建自定义机器人【AiBase提要:】🌐:HuggingFace近日推出了全新的聊天助手功能站长网2024-02-04 15:51:240000