Perplexity AI 发布 PPLX 在线语言模型,可能取代谷歌搜索引擎
Perplexity AI,这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司,通过结合网络索引和最新信息与会话式 AI 聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」,付费用户可以在这两者之间切换。
Perplexity AI 网站截图
AI 中的参数指的是每个模型的人工神经元之间的连接数,通常表明模型的强大和「智能」程度,参数越高通常意味着模型更加知识渊博、智能和高效。
为什么 Perplexity 的新在线 LLMs 很重要,它们与 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在线 LLMs 之所以重要,以及它们与 ChatGPT 等的区别,在于它们不仅可供其他组织通过 Perplexity 的 API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(为 ChatGPT 提供动力)难以做到的。
Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称,新的 PPX LLMs 是「首个实时 LLM API,它们基于网络搜索数据,没有知识截止日期!」
GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点,该功能于 2023 年 9 月底恢复。
通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力,这要归功于它与姐妹公司 X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付 X Premium 订阅。
其他 LLM 提供商,如加拿大多伦多的企业级 Cohere,旨在通过结合 Web 浏览功能和检索增强生成(RAG),将更多最新知识纳入其 LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。
在新的 PPLX 在线 LLMs 的情况下,Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」
在提供最新信息方面,Perplexity 是否优于 OpenAI 和 Meta?
为了证明其新 LLMs 的有效性,Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity 也称之为准确性)和新鲜度(后者指信息的最新程度)。
承包商被要求比较两个模型的回应,其中一些是 Perplexity 的新 PPLX 在线 LLMs,另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。
然后,Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨询顾问认为 LLM 回应的实用性,GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。
「总的来说,评估结果表明,我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌,甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好,」公司在描述新模型的博客文章中写道。
如何使用和影响
新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用,并按照那里发布的文档操作。此外,Perplexity 在其博客文章中指出,API 正从测试版可用性转向公众普遍可用性。
然而,这是有成本的:尽管是基于免费的开源模型进行培训的,Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用,现在将为用户提供 5 美元/月的信用额度,他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。
除此之外,用户还需要为额外的 API 调用(使用查询或提示访问模型)付费。Perplexity 尚未提供公开的定价信息,而是指示有兴趣的各方直接通过电子邮件与其联系。
虽然个人和企业对新模型的接受程度,无论是直接使用还是在新应用程序中使用,尚待观察,但Perplexity 已经赢得了一些热心粉丝的支持,他们认为这是搜索的未来,包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己与该公司「没有财务联系」。
随着谷歌的 Bard 因一些争议和差评而陷入困境,以及谷歌的后续 GPT 杀手 Gemini 据说被推迟,现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中,AI 助手与您对话并从网络中提取答案,而不是用户自己对搜索结果进行排序以找到最佳结果。
AIbase 上的 Perplexity AI PPLX 在线语言模型介绍:https://top.aibase.com/tool/pplx-online-llms
商汤科技发布自研中文语言大模型应用平台「商量SenseChat」
站长之家(ChinaZ.com)4月10日消息:商汤科技今日举行技术交流日活动。活动上,商汤科技展示了「日日新SenseNova」大模型体系。其中包括自然语言生成、文生图、感知模型标注和模型研发功能。站长网2023-04-12 11:29:130001研究发现利用特定的提示可「越狱」ChatGPT 和 Bard 等 AI 聊天机器人
来自卡内基梅隆大学、人工智能安全中心和博世人工智能中心的研究团队日前展示了如何「越狱」最先进、大型语言模型(LLM)AI聊天机器人。他们发现,通过给给定的提示添加特定的字符串,可以欺骗这些工具产生有害内容。尽管团队在一个开源的公开LLM上进行了实验,但研究人员表示,他们发现的技术也适用于广泛使用的闭源聊天机器人,包括ChatGPT和Bard。站长网2023-08-03 11:28:140000OpenAI公开招人!骗骗大模型就给钱,一年只工作5-10小时,无需技术背景
OpenAI又招人了,非技术出身那种!一年只需5-10小时工作。不仅能够从中获得报酬,还能得到和各界大佬展开交流的机会。这次OpenAI招募的是红队军团成员,也就是以对抗性方式帮助提高模型安全性的外部专家。OpenAI总裁Brockman也在个人账号上发表了这则消息,而此前他刚刚和马斯克等人探讨了AI的安全问题。此次招募的目的说起来也很简单——安全、安全,还是安全。不懂技术也能报名站长网2023-09-22 21:11:530000360智脑通过中国信通院可信AIGC大语言模型功能评估
360官方表示,360智脑成为国内首个通过信通院可信AIGC大模型评估的大模型产品。6月12日,360智脑的360GPT-S2-V8型号产品获得了中国信息通信研究院“可信AIGC大语言模型基础能力”评估报告,报告显示必选项目评估内容均通过。站长网2023-06-13 14:58:500000AI不会淘汰创作者,但率先掌握AI的创作者会
“我的AI角色成为了目前的顶流。”说这话的人是“冷门歌手”孙燕姿。最近,她的声音被AI改编,用于翻唱其他歌手的歌曲,不论是《发如雪》还是《好汉歌》,在网络上人们都能找到AI孙燕姿的版本。孙燕姿本人也站出来回应,语气平静,“你跟一个每几分钟就推出一张新专辑的人还有什么好争的。”正如孙燕姿所言,“之前我们一直坚信,思想或观点的形成是机器无法复制的任务,这超出了它们的能力范围,但现在它却赫然耸现。”站长网2023-05-27 10:02:320003