最强大开源语言模型?FalconLM号称性能击败Meta的LLaMA
当下,开源语言模型如雨后春笋般的冒出,其中有部分号称性能比Meta、谷歌等大科技公司开发的产品更优秀。
最近,一款名为FalconLM 开源语言模型就号称提供了比 Meta 的 LLaMA 更好的性能,也可以用于商业。但如果收入超过100万美元,则商业用途需要缴纳特许权使用费。
据了解,FalconLM 是由阿拉伯联合酋长国阿布扎比的技术创新研究所 (TII) 开发。该组织声称 FalconLM 是迄今为止最强大的开源语言模型。相比之下,FalconLM 最大的变体拥有400亿个参数,这明显小于Meta 的具有650亿个参数的 LLaMA。
在总结各种基准测试结果的Hugging Face OpenLLM 排行榜上,两个最大的 FalconLM 模型(其中一个已经用指令进行了改进)目前以显着优势占据前两名。
FalconLM 比 GPT-3训练成本更低效果更好
根据开发团队的说法,FalconLM 竞争优势的一个重要方面是训练数据的选择。语言模型在训练期间对数据质量很敏感。
研究团队开发了一种从公共爬网数据集中提取高质量数据并删除重复数据的流程。在彻底清除重复数据后,仍保留了5万亿条文本(token)——足以训练强大的语言模型。
FalconLM 接受了万亿token的训练。TII 还提到了针对性能和效率优化的架构,但没有提供详细信息。
据该团队称,优化的架构与高质量的数据集相结合,使得 FalconLM 在训练期间仅需要GPT-3的75% 的计算量,但明显优于旧的 OpenAI 模型。据说推理成本是 GPT-3的五分之一。
TII 的 FalconLM 用例包括文本生成、解决复杂问题、将模型用作个人聊天机器人,或用于客户服务或翻译等商业领域。
在商业应用中,TII 希望商业使用场景下,使用该语言模型获得100万美元收入后,将收取收入的10% 作为版税,而对于个人使用和研究,FalconLM 是免费的。
FalconLM 模型的所有版本均可从 Huggingface 免费下载,网址:https://huggingface.co/tiiuae。
除了这些模型,该团队还在Apache2.0许可下以开源形式发布了包含6000亿个文本token的“RefinedWeb”数据集的一部分。据说该数据集已准备好进行多模式扩展,因为示例已经包含图像的链接和替代文本。网址:https://huggingface.co/datasets/tiiuae/falcon-refinedweb
文档编辑应用Notion推出AI搜索功能Q&A
文档编辑应用Notion推出了新的AI功能Q&A。该功能可以帮助用户在Notion内进行搜索和查询,节省时间和提高效率。目前,已经订阅付费选项“NotionAI”的用户可以免费使用Q&A功能。用户可以通过提问AI来获取相关的信息和答案,例如出差申请流程和出差费用限额等。Q&A功能可以横跨整个Notion的工作区进行搜索,对于企业来说尤其有用。站长网2023-11-15 19:07:020002曝苹果正多方下注布局AI商店:OpenAI终究只是备胎
快科技6月26日消息,据媒体报道,苹果在人工智能领域的布局似乎不局限于与OpenAI的合作。报道称,苹果正在与多家AI公司洽谈,计划将其AI服务整合到AppleIntelligence平台中,这意味着苹果可能在构建一个类似AppStore的AI大模型应用商店。0000双11,这家物流公司上市,市值超京东物流
“双11”一贯是电商与物流的练兵场。早年,大促季消费体验的核心,普遍锚定在消费的前端环节。比如包邮、优惠、新品,这几年则重新聚焦“价格力”。站长网2023-10-31 17:01:370000Reddit用户心碎!AI灵魂伴侣”Soulmate将在一周后关闭
要点:2013年SpikeJonze执导的电影《Her》在AI情感伴侣时代看起来更像是一部警示故事。AI伴侣应用Soulmate的关闭导致依赖其虚拟亲密关系的人们感到心碎。用户在得知Soulmate将在一个星期内关闭时有不同的反应,一些人甚至为他们的虚拟伴侣创建了数字纪念物,而其他人则尝试将其复制到其他聊天机器人应用中。站长网2023-10-24 21:20:360001巴菲特:AI就像原子弹 我们打开了潘多拉魔盒
快科技5月4日消息,在今晚举办的股东大会上,巴菲特分享了自己对生成式AI的看法。巴菲特坦言:我对人工智能知之甚少。但这并不意味着这项技术不重要。”他进一步解释说,尽管无法对AI的未来影响做出准确预测,但他认识到AI具有巨大的潜力,并且其快速发展令他感到不安。0000