Perplexity AI 发布 PPLX 在线语言模型,可能取代谷歌搜索引擎
Perplexity AI,这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司,通过结合网络索引和最新信息与会话式 AI 聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」,付费用户可以在这两者之间切换。

Perplexity AI 网站截图
AI 中的参数指的是每个模型的人工神经元之间的连接数,通常表明模型的强大和「智能」程度,参数越高通常意味着模型更加知识渊博、智能和高效。
为什么 Perplexity 的新在线 LLMs 很重要,它们与 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在线 LLMs 之所以重要,以及它们与 ChatGPT 等的区别,在于它们不仅可供其他组织通过 Perplexity 的 API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(为 ChatGPT 提供动力)难以做到的。
Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称,新的 PPX LLMs 是「首个实时 LLM API,它们基于网络搜索数据,没有知识截止日期!」
GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点,该功能于 2023 年 9 月底恢复。
通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力,这要归功于它与姐妹公司 X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付 X Premium 订阅。
其他 LLM 提供商,如加拿大多伦多的企业级 Cohere,旨在通过结合 Web 浏览功能和检索增强生成(RAG),将更多最新知识纳入其 LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。
在新的 PPLX 在线 LLMs 的情况下,Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」
在提供最新信息方面,Perplexity 是否优于 OpenAI 和 Meta?
为了证明其新 LLMs 的有效性,Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity 也称之为准确性)和新鲜度(后者指信息的最新程度)。
承包商被要求比较两个模型的回应,其中一些是 Perplexity 的新 PPLX 在线 LLMs,另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。
然后,Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨询顾问认为 LLM 回应的实用性,GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。
「总的来说,评估结果表明,我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌,甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好,」公司在描述新模型的博客文章中写道。
如何使用和影响
新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用,并按照那里发布的文档操作。此外,Perplexity 在其博客文章中指出,API 正从测试版可用性转向公众普遍可用性。
然而,这是有成本的:尽管是基于免费的开源模型进行培训的,Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用,现在将为用户提供 5 美元/月的信用额度,他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。
除此之外,用户还需要为额外的 API 调用(使用查询或提示访问模型)付费。Perplexity 尚未提供公开的定价信息,而是指示有兴趣的各方直接通过电子邮件与其联系。
虽然个人和企业对新模型的接受程度,无论是直接使用还是在新应用程序中使用,尚待观察,但Perplexity 已经赢得了一些热心粉丝的支持,他们认为这是搜索的未来,包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己与该公司「没有财务联系」。
随着谷歌的 Bard 因一些争议和差评而陷入困境,以及谷歌的后续 GPT 杀手 Gemini 据说被推迟,现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中,AI 助手与您对话并从网络中提取答案,而不是用户自己对搜索结果进行排序以找到最佳结果。
AIbase 上的 Perplexity AI PPLX 在线语言模型介绍:https://top.aibase.com/tool/pplx-online-llms
谷歌DeepMind推出RT-2 使机器人更智能
谷歌的DeepMind宣布了机器人变换器2(RT-2),这是一种首创的视觉-语言-行为(VLA)模型,可以使机器人在没有特定训练的情况下执行新的任务。就像语言模型如何从网络规模的数据中学习一般的想法和概念一样,RT-2使用网络上的文本和图像来理解不同的现实世界概念,并将这些知识转化为机器人行为的通用指令。站长网2023-08-01 09:38:060000比亚迪旗下纯电动超跑仰望U9将于2月25日上市
近日,据汽车之家报道,比亚迪旗下高端品牌仰望的一款纯电动超跑——仰望U9,将于2月25日正式上市。仰望U9以其激进的外观造型和强大的动力性能,吸引了众多消费者的关注。新车采用了时空之门家族式设计语言,C型标志性大灯使得前脸极具辨识度。而蝴蝶门开启方式,更是将其超跑属性展现得淋漓尽致。站长网2024-02-16 12:46:530000魅族Flyme中文OS名投票正式开启 “无界”暂时领先
魅族科技最近启动了一个为Flyme操作系统征集中文名称的活动,今日,魅族宣布中文OS名投票正式开启,经过几轮投票后,最终将在发布会现场确定名称。此前,魅族表示,Flyme也需要一个像鸿蒙、澎湃一样响亮的中文名。从目前的投票情况来看,大多数人倾向于使用“无界”作为Flyme的中文名称。这个名称也符合魅族所强调的“无界”概念,即通过多终端融合,为用户提供全方位、沉浸式的体验。站长网2023-11-27 14:17:460000深兰科技推出大语言模型平台“深兰硅基大脑SaaS平台”
站长之家(ChinaZ.com)6月21日消息:近日,深兰科技创始人、董事长陈海波宣布,深兰科技推出大语言模型SaaS平台——深兰硅基大脑SaaS平台,旨在为个人和企业提供更便捷、更全面的大语言模型智能化应用。站长网2023-06-21 15:13:160001Google AI推出SANPO:多属性视频数据集助力高级视觉场景理解
划重点:-GoogleAI推出了SANPO数据集,用于户外人类主观场景理解。-SANPO包括真实世界和合成数据,具有丰富的注释和多属性特征。-这个数据集将有助于研究人员开发视觉导航系统,支持视障人士,并拓展先进的视觉场景理解。站长网2023-10-16 10:58:090000