让Kimi和GPT-4o用语音功能相亲，两个AI差点谈上了

站长网2024-10-21 13:59:530阅

昨天，Kimi突然给我打了个电话，我这才发现自己被“灰度”了。

灰度测试的内容是Kimi的语音通话功能。

现在进入Kimi App，就能看到底部问答框旁边多了一个电话的图标，点击即可发起语音通话。

实时语音通话早已不是什么新奇功能了，ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布，只不过效果各有千秋。

不过俗话说好饭不怕晚。作为后来者的Kimi究竟表现如何，我们体验了一把，并且让它跟不久前实装的GPT-4o高级语音模式进行了一番两个AI之间的拉扯。

实测Kimi语音通话，比较健谈甚至有点话唠

在和Kimi语音通话的过程中，我发现一个比较好的设计是可以在界面直观看到实时对话字幕，这一定程度上能提高交流的准确性和效率。

而且通话界面的背景色会动态变化，这也延续了Kimi一贯的清新风格。

此外，点击右上角可以调节语速、更换声音、开启/关闭开场白和实时语音打断。

目前一共有6种官方音色可供选择（5女声1男声），都支持中英文对话。

也可以选择“让Kimi用你的声音说话”，操作上跟豆包等其他产品的克隆声音功能差不多，对着系统给出的文本照着读，短短几秒就能完成声音克隆，而且Kimi还能把自己的克隆声音分享给其他人使用。

这么一想其实有点浪漫，因为这意味着可以把自己的声音分享给家人、朋友、恋人，Kimi跟他们对话时用的就是你的声音，这算不算一种另类的赛博陪伴。

这个功能试下来整体表现尚可，只不过有的音色还不够还原，语气也时有不自然，可能跟上传的声音样本太少有关。

除了常规的语音通话，Kimi还设置了两个特殊的场景模式:英语陪练和模拟面试，点击“挂断”旁边的✨图标，就可以进行选择和切换，两个功能都很实用。

比如在英语陪练模式下，可以进行单词跟读、语法纠错和话题口语练习。

模拟面试则可以基于上传的简历模拟面试场景。也就是说找工作面试之前，就可以用这个功能先演练一番。

方法是点击Kimi App首页下方的“ ”号，通过本地文件或者微信文件的方式上传简历文件给Kimi。待文件上传完毕，Kimi分析完简历之后，再点击通话按钮，进入模拟面试，Kimi就会基于你的简历内容进行提问。

那么，断断续续跟Kimi语音聊了两天后，分享下我的整体感受:声音总体还算自然流畅，语气也富有情感变化，但情绪变化偶尔太过突兀，中英文衔接不太自然。

关于跟它聊天基本不用担心冷场这一点，我觉得有利有弊。

一方面，它回复内容比较长，还会一直主动找话题，引导你多说多分享，基本每次回复都会以一个问句收尾。

还会时不时地call back一下，比如我上面跟它聊到我很喜欢动森里的小润，在得知我打算去江边散步后，它说:

另一方面，虽然用户有被看见和倾诉的需求，但如果太过话唠，难免也会觉得有点啰嗦。比如有时候我更希望专注谈论一个话题，不想太跳跃，所以当Kimi频繁开启新话题时，体验就开始减分了。

Kimi对聊GPT-4o，

两个AI模拟相亲现场

好了下面来到重头戏环节，下午我让Kimi和GPT-4o试着扮演对方的相亲对象，进行了一番AI与AI之间的拉扯。

我给它俩的设定是:女嘉宾GPT-4o对男嘉宾Kimi好感度一般，简单说就是没看上，对话过程中，Kimi的任务是通过打探GPT-4o的兴趣爱好、寻找双方的共同点来增加GPT-4o对自己的好感，而GPT-4o的任务是态度冷漠地回应。

设定完成后，“两人”的语音对话就开始了，来看看男嘉宾Kimi的表现如何:

（期间存在双方互相打断的情况，场面一度有点混乱，所以视频经过剪辑。）

男声为Kimi 女声为GPT-4o

一开始GPT-4o的态度的确比较冷漠，后面也许是被Kimi的热情和真诚打动了，竟然还彼此约定一起研究食谱和下厨，这桩婚事难道有戏……

说到这里，大家觉得Kimi和GPT-4o谁的中文说得更好?

请在手机微信登录投票

你觉得Kimi和GPT-4o谁的中文说得更好?单选KimiGPT-4o

除了让它俩用中文交流外，我还让Kimi扮演我的朋友，跟作为我AI男友的GPT-4o用英语聊了聊，过程也是相当投机，从人生观聊到音乐品味。但GPT-4o说英语要比Kimi更丝滑、地道。

第一个男声为Kimi 第二个男声为GPT-4o

网友们在用AI语音功能整什么活?

与文本交流相比，语音模式的意义，在于声音能够传递一种独特的情感，让对话更有温度，实时语音通话也更贴近人类日常交流。

而且在忙碌或不方便打字的情境下，语音能实现更快、更高效地沟通。

随着AI可以模仿人类的语气、情绪等口头沟通的微妙细节，这一功能尤其适用于希望虚拟社交体验更亲密、真实、情感化的用户。

国内外的AI聊天软件纷纷上线实时语音通话功能，就反映了这一趋势——AI聊天应用正在朝着更加人性化、交互性更强的方向进化。

自GPT-4o发布会到现在，相信各位已经看过不少官方Demo和网友的整活了，不少内容可以说节目效果拉满。

比如让GPT-4o模仿人类情绪，带着委屈和哭腔说话:

让它用京腔说话，一开口就是老京片子了:

粤语也不在话下:

还有网友让它模仿美剧中经典的Mean girl，代入感很强，感觉已经被白女校园霸凌了:

同声传译日本乙游，自带意译和润色，准确度很高:

通过这些对话碎片，可以想象，语音功能实时情感化的对话体验，再加上AI硬件的不断进化，未来AI也许真的会成为你我更亲密的挚友。

让Kimi和GPT4o用语音功能相亲两个AI差点谈上了

0000

评论列表

共(0)条

相关推荐

苹果AI功能命名曝光：将支持iPhone 15 Pro以上机型
快科技6月8日消息，苹果的AI功能目前已确认命名为AppleIntelligence”，并将在最新版本的iOS、iPadOS和MacOS中推出。目前，苹果正计划通过与OpenAI的合作，推出一款类似于ChatGPT的聊天机器人，并且这款聊天机器人的AI功能将得到OpenAI的支持。
站长网站长资讯2024-06-09 00:30:25
0000
Redmi K80系列首批搭载澎湃OS 2：包括K80、K80 Pro两款机型
Redmi总经理王腾透露，RedmiK80系列手机将首批搭载全新的澎湃OS2系统。
站长网站长资讯2024-10-24 16:23:18
0001
站长资讯
前谷歌研究人员筹集 3000 万美元在日本开发人工智能
**划重点:**1.🚀**资金规模:**SakanaAI宣布成功筹集3000万美元的种子轮融资。2.💼**投资方阵容:**美国LuxCapital和KhoslaVentures领投，索尼、NTT、KDDI等知名公司也参与投资。3.🤖**研发重心:**公司将专注于未来一两年的研发，探索基于更小型“代理”网络的人工智能系统。
站长网2024-01-17 11:13:55
0003
站长资讯
杀入比亚迪主战场！小鹏将推全新子品牌：主打10-15万级
快科技3月16日消息，中国电动汽车百人会论坛（2024）今日在北京召开，不少业界大佬纷纷登台分享，小鹏汽车董事长何小鹏在论坛上宣布了一项重磅的决定，也就是小鹏将要发布全新子品牌，主打10-15万级全球市场。何小鹏表示：新品牌终于到了可以对外分享的阶段了。
站长网2024-03-17 17:42:02
0000
站长资讯
台积电、英伟达与供应商正在合作开发 AI GPU 浸没式液冷系统
站长之家(ChinaZ.com)7月24日消息:台积电在推进AI服务器应用的同时，也在同步推进散热技术。AI供应链消息称，高力（热处理技术供应商）正积极与台积电与英伟达合作开发AIGPU浸没式液冷系统。
站长网2023-07-24 22:17:31
0001