首页站长资讯Perplexity AI 发布 PPLX 在线语言模型，可能取代谷歌搜索引擎

Perplexity AI 发布 PPLX 在线语言模型，可能取代谷歌搜索引擎

站长网2023-11-30 10:45:211阅

Perplexity AI，这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司，通过结合网络索引和最新信息与会话式 AI 聊天机器人界面，有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot，直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」，付费用户可以在这两者之间切换。

Perplexity AI 网站截图

如今， Perplexity 公司向成为首选搜索引擎目的地迈出了又一步，发布了自己的大型语言模型（LLMs）——pplx-7b-online 和 pplx-70b-online，分别以它们的参数大小 7 亿和 70 亿命名。这些模型是基于 Mistral 和 Meta 的开源 mistral-7b 和llama2-70b 模型进行微调和增强的版本。

AI 中的参数指的是每个模型的人工神经元之间的连接数，通常表明模型的强大和「智能」程度，参数越高通常意味着模型更加知识渊博、智能和高效。

为什么 Perplexity 的新在线 LLMs 很重要，它们与 ChatGPT 和其他 LLMs 有何不同？

Perplexity 的新在线 LLMs 之所以重要，以及它们与 ChatGPT 等的区别，在于它们不仅可供其他组织通过 Perplexity 的 API（应用程序编程接口）使用和构建自己的应用程序，而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs，包括 OpenAI 的 GPT-3.5 和 GPT-4（为 ChatGPT 提供动力）难以做到的。

Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称，新的 PPX LLMs 是「首个实时 LLM API，它们基于网络搜索数据，没有知识截止日期！」

GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月，直到今年早些时候才有所提升。尽管如此，这与内置了当前事件和最新消息的知识相比还有很大差距，尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点，该功能于 2023 年 9 月底恢复。

通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克（Elon Musk）夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力，这要归功于它与姐妹公司 X（前推特）的直接整合，以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版，并将在本周推出供任何人使用，前提是用户支付 X Premium 订阅。

其他 LLM 提供商，如加拿大多伦多的企业级 Cohere，旨在通过结合 Web 浏览功能和检索增强生成（RAG），将更多最新知识纳入其 LLMs，这使模型能够借助管理员提供的外部信息来源，如公司文件。

在新的 PPLX 在线 LLMs 的情况下，Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写：「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大，定期更新，并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录，我们称之为『片段』，使其能够用最新的信息做出回应。」

在提供最新信息方面，Perplexity 是否优于 OpenAI 和 Meta？

为了证明其新 LLMs 的有效性，Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答：有用性、事实性（Perplexity 也称之为准确性）和新鲜度（后者指信息的最新程度）。

承包商被要求比较两个模型的回应，其中一些是 Perplexity 的新 PPLX 在线 LLMs，另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo，选择他们更喜欢的两者之间的回应。

然后，Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出，其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面，即咨询顾问认为 LLM 回应的实用性，GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。

「总的来说，评估结果表明，我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌，甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好，」公司在描述新模型的博客文章中写道。

如何使用和影响

新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用，并按照那里发布的文档操作。此外，Perplexity 在其博客文章中指出，API 正从测试版可用性转向公众普遍可用性。

然而，这是有成本的：尽管是基于免费的开源模型进行培训的，Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用，现在将为用户提供 5 美元/月的信用额度，他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。

除此之外，用户还需要为额外的 API 调用（使用查询或提示访问模型）付费。Perplexity 尚未提供公开的定价信息，而是指示有兴趣的各方直接通过电子邮件与其联系。

虽然个人和企业对新模型的接受程度，无论是直接使用还是在新应用程序中使用，尚待观察，但Perplexity 已经赢得了一些热心粉丝的支持，他们认为这是搜索的未来，包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures，他表示自己与该公司「没有财务联系」。

随着谷歌的 Bard 因一些争议和差评而陷入困境，以及谷歌的后续 GPT 杀手 Gemini 据说被推迟，现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中，AI 助手与您对话并从网络中提取答案，而不是用户自己对搜索结果进行排序以找到最佳结果。

AIbase 上的 Perplexity AI PPLX 在线语言模型介绍：https://top.aibase.com/tool/pplx-online-llms

PerplexityAI 发布 PPLX在线语言模型可能取代谷歌搜索引擎

0001

评论列表

共(0)条

相关推荐

站长资讯
谷歌DeepMind推出RT-2 使机器人更智能
谷歌的DeepMind宣布了机器人变换器2（RT-2），这是一种首创的视觉-语言-行为(VLA)模型，可以使机器人在没有特定训练的情况下执行新的任务。就像语言模型如何从网络规模的数据中学习一般的想法和概念一样，RT-2使用网络上的文本和图像来理解不同的现实世界概念，并将这些知识转化为机器人行为的通用指令。
站长网2023-08-01 09:38:06
0000
站长资讯
比亚迪旗下纯电动超跑仰望U9将于2月25日上市
近日，据汽车之家报道，比亚迪旗下高端品牌仰望的一款纯电动超跑——仰望U9，将于2月25日正式上市。仰望U9以其激进的外观造型和强大的动力性能，吸引了众多消费者的关注。新车采用了时空之门家族式设计语言，C型标志性大灯使得前脸极具辨识度。而蝴蝶门开启方式，更是将其超跑属性展现得淋漓尽致。
站长网2024-02-16 12:46:53
0000
站长资讯
魅族Flyme中文OS名投票正式开启 “无界”暂时领先
魅族科技最近启动了一个为Flyme操作系统征集中文名称的活动，今日，魅族宣布中文OS名投票正式开启，经过几轮投票后，最终将在发布会现场确定名称。此前，魅族表示，Flyme也需要一个像鸿蒙、澎湃一样响亮的中文名。从目前的投票情况来看，大多数人倾向于使用“无界”作为Flyme的中文名称。这个名称也符合魅族所强调的“无界”概念，即通过多终端融合，为用户提供全方位、沉浸式的体验。
站长网2023-11-27 14:17:46
0000
站长资讯
深兰科技推出大语言模型平台“深兰硅基大脑SaaS平台”
站长之家(ChinaZ.com)6月21日消息:近日，深兰科技创始人、董事长陈海波宣布，深兰科技推出大语言模型SaaS平台——深兰硅基大脑SaaS平台，旨在为个人和企业提供更便捷、更全面的大语言模型智能化应用。
站长网2023-06-21 15:13:16
0001
站长资讯
Google AI推出SANPO:多属性视频数据集助力高级视觉场景理解
划重点:-GoogleAI推出了SANPO数据集，用于户外人类主观场景理解。-SANPO包括真实世界和合成数据，具有丰富的注释和多属性特征。-这个数据集将有助于研究人员开发视觉导航系统，支持视障人士，并拓展先进的视觉场景理解。
站长网2023-10-16 10:58:09
0000