Perplexity AI 发布 PPLX 在线语言模型,可能取代谷歌搜索引擎
Perplexity AI,这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司,通过结合网络索引和最新信息与会话式 AI 聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」,付费用户可以在这两者之间切换。

Perplexity AI 网站截图
AI 中的参数指的是每个模型的人工神经元之间的连接数,通常表明模型的强大和「智能」程度,参数越高通常意味着模型更加知识渊博、智能和高效。
为什么 Perplexity 的新在线 LLMs 很重要,它们与 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在线 LLMs 之所以重要,以及它们与 ChatGPT 等的区别,在于它们不仅可供其他组织通过 Perplexity 的 API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(为 ChatGPT 提供动力)难以做到的。
Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称,新的 PPX LLMs 是「首个实时 LLM API,它们基于网络搜索数据,没有知识截止日期!」
GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点,该功能于 2023 年 9 月底恢复。
通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力,这要归功于它与姐妹公司 X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付 X Premium 订阅。
其他 LLM 提供商,如加拿大多伦多的企业级 Cohere,旨在通过结合 Web 浏览功能和检索增强生成(RAG),将更多最新知识纳入其 LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。
在新的 PPLX 在线 LLMs 的情况下,Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」
在提供最新信息方面,Perplexity 是否优于 OpenAI 和 Meta?
为了证明其新 LLMs 的有效性,Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity 也称之为准确性)和新鲜度(后者指信息的最新程度)。
承包商被要求比较两个模型的回应,其中一些是 Perplexity 的新 PPLX 在线 LLMs,另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。
然后,Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨询顾问认为 LLM 回应的实用性,GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。
「总的来说,评估结果表明,我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌,甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好,」公司在描述新模型的博客文章中写道。
如何使用和影响
新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用,并按照那里发布的文档操作。此外,Perplexity 在其博客文章中指出,API 正从测试版可用性转向公众普遍可用性。
然而,这是有成本的:尽管是基于免费的开源模型进行培训的,Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用,现在将为用户提供 5 美元/月的信用额度,他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。
除此之外,用户还需要为额外的 API 调用(使用查询或提示访问模型)付费。Perplexity 尚未提供公开的定价信息,而是指示有兴趣的各方直接通过电子邮件与其联系。
虽然个人和企业对新模型的接受程度,无论是直接使用还是在新应用程序中使用,尚待观察,但Perplexity 已经赢得了一些热心粉丝的支持,他们认为这是搜索的未来,包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己与该公司「没有财务联系」。
随着谷歌的 Bard 因一些争议和差评而陷入困境,以及谷歌的后续 GPT 杀手 Gemini 据说被推迟,现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中,AI 助手与您对话并从网络中提取答案,而不是用户自己对搜索结果进行排序以找到最佳结果。
AIbase 上的 Perplexity AI PPLX 在线语言模型介绍:https://top.aibase.com/tool/pplx-online-llms
Transformer“贡献”作者,重返谷歌出任Gemini联合技术主管
出任Gemini联合技术主管!这就是Transformer“贡献最大”作者NoamShazeer(诺姆·沙泽尔),重返谷歌后的最新动向。据TheInformation的更多爆料,Shazeer将与谷歌AI主管JeffDean和DeepMind首席科学家OriolVinyals,一起致力于Gemini的开发。站长网2024-08-27 07:25:240000Meta开源的密集视频跟踪工具CoTrack
CoTracker是一个用于视频中任意点跟踪的transformer模型。它可以像光流一样跟踪视频中的每个像素、网格点或手动选择的点。站长网2023-09-01 10:47:310000冯提莫“二次跳槽”:签约抖音游戏公会,重心还在直播吗?
与B站合约到期、停播7个月后,冯提莫要回归了。7月6日,抖音游戏公会“微应互动”发布了与冯提莫签约的消息。随后,冯提莫工作室也官宣了该消息。签约抖音公会,冯提莫这是要来抖音开播了?对此,新播场咨询了微应互动相关人士,对方称冯提莫后续动向以她的团队发声为准,并表示快了。冯提莫直播至今已经接近10年,在斗鱼、B站都曾是“一姐”的存在。站长网2023-07-14 20:07:510003直播新风口,团播为何让人上头?
“招募团播女主播,底薪8000元提成”、“才艺团保底10000元起,免费舞蹈培训”、“保底8000-15000元,目前团播主播综合月收入50000元以上”......在招聘市场上,这样的信息格外亮眼,并且有着大量需求,这些岗位来自当下火爆的团播直播间。所谓团播指的是主播人数多于两个的直播间,一般由3-5名主播组成,并配有一个专门控场的主持人。站长网2024-09-10 16:26:110000谦寻回应薇娅电商公司申请注销:相关业务已被谦寻文化承接
据36氪消息,针对薇娅电商公司申请注销一事,谦寻回应称,由于公司战略调整,原谦寻电子经营业务已于2019年起为谦寻文化承接。此前,天眼查App显示,近日,杭州谦寻电子商务有限公司新增简易注销公告,公告期自6月7日至6月26日。该公司成立于2016年11月,法定代表人、执行董事兼总经理为董海锋(薇娅丈夫),同时董海锋持有该公司51%股份,为第一大股东及疑似实际控制人。站长网2023-06-12 22:57:130000