谷歌的Bard在聊天机器人排名中击败了GPT-4
**划重点:**
1. 🚀 Bard的Gemini Pro版本在LMSYS聊天机器人榜上超越了GPT-4,标志着聊天机器人领域的重大变革。
2. 📈 Bard现在是LMSYS榜上第二高分的聊天机器人,正在迎头赶上保持冠军的GPT-4Turbo。
3. 💡 Bard的崛起得益于搭载谷歌最新的Gemini Pro大型多模态模型,成为该榜上第二个获得超过1200分的模型。
谷歌的Bard最近通过其Gemini Pro版本在LMSYS聊天机器人榜上超越了OpenAI的GPT-4,标志着聊天机器人领域的一次显著变革。这款更新使得Bard成为LMSYS榜上第二高分的聊天机器人,逐渐摆脱了OpenAI在聊天机器人领域的主导地位。
在LMSYS Chatbot Arena Leaderboard上,Bard成功超越了GPT-4,目前正迅速追赶保持冠军的GPT-4Turbo。长期以来,GPT-4Turbo和GPT-4一直紧握榜单前两名,而Bard的崛起得益于其搭载谷歌新的Gemini Pro大型多模态模型。
LMSYS Org创建了Chatbot Arena Leaderboard,该组织是由加州大学伯克利分校与加州大学圣迭戈分校以及卡内基梅隆大学合作成立的大型模型系统组织。他们表示,Bard在排行榜上的飙升是一个“显著的成就”。
Chatbot Arena是一个用于大型语言模型的基准平台,采用“匿名、随机的众包方式进行战斗”。排名基于Elo评分系统,这在国际象棋和其他竞技游戏中被广泛使用。
由Gemini Pro驱动的Bard是该榜上第二个达到1200分以上的模型。Bard的崛起是谷歌更新了支持聊天机器人的基础模型的结果。去年12月,谷歌推出了Gemini,并为Bard推出了初始版本Gemini Pro,预计将很快发布更大规模的版本Gemini Ultra。
Bard还成功击败了Claude的所有版本,Gemini Pro Dev API版本的排名甚至超过了Anthropic的Claude2.1和GPT3.5Turbo。LMSYS表示:“比赛变得前所未有地激烈!非常期待看到Bard Gemini Ultra版本的未来。”
对于谷歌而言,这次在榜单上的崛起是一个受欢迎的喘息。在经历了起伏不定的开始后,Bard通过定期更新不断增强,现在已经整合到其他谷歌应用程序,如YouTube和Docs中。
最近,Reddit用户告诉谷歌,他们希望Bard更像ChatGPT,谷歌产品经理询问了他们的愿望清单。用户要求有专门的移动应用程序、自定义指令和图像生成,其中一些建议已经在实施中。
OpenAI的GPT-4一直在模型榜单上居高不下,牢牢占据斯坦福大学HELM Leaderboard的第一名,而GPT-4Turbo则居于第二位。曾经为Bard提供动力的PaLM2在HELM排行榜上表现不佳,被来自AI初创公司Writer的Palmyra X V3超越,成为排行榜上最高得分的非OpenAI模型。
掘金本地生活:头部达人月入30万,8成难过万
2018年,抖音成立POI(兴趣点)团队开始探索“本地生活”赛道,两年后,抖音建立本地探店达人体系,达人探店视频开始风靡短视频平台。达人探店模式下,涌现出一批头部网红探店达人,诸如浪胃仙、密子君、二百者也、白冰、乌拉拉、真探高文麒等等。他们探店后推荐的商家门店,很容易成为年轻人打卡胜地。甚至不少生意惨淡或销量不佳的商家,因为达人探店而扭亏为盈,“起死回生”。站长网2023-08-21 22:16:500000研究:AI模型仍不擅长生成干净代码 GPT-4的API误用率达62%
文章概要:1.AI模型在回答Java编码问题时,仍存在许多API误用问题。GPT-3.5和GPT-4的API误用率分别达到49.83%和62.09%。2.Llama2API误用率最低,但由于它生成的代码较少,误导性很大。一旦生成更多代码,其误用率也大幅上升。3.添加相关API使用示例能稍微改善结果,但仍有改进空间。代码的可靠性和稳健性仍是难题。站长网2023-08-30 16:43:280000人工智能监管新思路,用AI监管AI可行吗?
站长网2023-07-20 12:59:290000清华大学团队推出RTFS-Net:革新视听语音分离,百万参数实现高效性能
**划重点:**1.🎙️RTFS-Net是首个采用少于100万个参数的视听语音分离方法,通过压缩-重建策略显著减少计算复杂度。2.🌐针对传统视听语音分离方法的问题,RTFS-Net创新性地解决了时域和时频域方法的挑战,提高了在复杂环境中的性能。3.🚀在三个基准多模态语音分离数据集上,RTFS-Net在大幅降低模型参数和计算复杂度的同时,接近或超越了当前最先进的性能。站长网2024-03-06 17:46:320002我在TikTok上卖车给老外,三个月入账2000万
抱着“反正亏不了多少钱”的心态,安岚(化名)在TikTok上试着把中国汽车卖给老外。短短一个季度,她就拿下了2000万元的营收,而投入仅2000元左右。在此之前,她从未有过任何销售工作经验。去年8月初,安岚带着一身的疲惫从某互联网大厂裸辞,“想躺一段时间”。但一条新闻让她打消了休息的念头:2023年上半年,中国汽车出口量同比增超70%。“我一直以为,中国汽车在国外卖不动的。”站长网2024-03-14 14:05:270001