1800亿参数,支持中文,3.5万亿训练数据!开源类ChatGPT模型
阿联酋阿布扎比技术创新研究所(Technology Innovation Institute,简称TII)在官网发布了,目前性能最强的开源大语言模型之一Falcon180B。
TII表示,Falcon180B拥有1800亿参数,使用4096个GPU在3.5万亿token 数据集上进行训练,这也是目前开源模型里规模最大的预训练数据集之一。Falcon180B有基础和聊天两个模型,允许商业化。
Falcon180B在多个权威测试平台中,在推理、编程、知识测试等方面,超过了Meta最新发布的 Llama270B 和 OpenAI 的 GPT-3.5,可媲美谷歌的PaLM2-Large仅次于GPT-4。
基础开源地址:https://huggingface.co/tiiuae/falcon-180B
聊天开源地址:https://huggingface.co/tiiuae/falcon-180B-chat
在线测试地址:https://huggingface.co/spaces/tiiuae/falcon-180b-demo

今年5月,「AIGC开放社区」曾介绍过TII发布的一款类ChatGPT开源大语言模型Falcon-40B。
该产品刚推出便成为Huggingface的开源大语言模型排行第一名,击败了LLaMa65b、GPT4-X-Alpasta-30b、LLaMa30b等众多著名开源项目成为一匹黑马。
Falcon180B便是在Falcon-40B基础之上研发而成,并将模型参数扩大了4.5倍,训练集从1万亿提升至3.5万亿token,并在算法、推理、硬件部署方面进行了大幅度优化。
其中,最大的亮点就是Falcon180B- chat版本支持中文,并进行了数据微调。
Falcon180B简单介绍
预训练方面,Falcon180通过使用 Amazon SageMaker 在多达4096个GPU上同时对3.5万亿个token数据集进行训练,总共花费了约7,000,000个小时。
TII表示,Falcon180B的规模是Llama2的2.5倍,而训练所需的算力资源是Llama2的4倍。
Falcon180B的训练数据集主要来自RefinedWeb的网络数据(大约占85%)。还在对话、技术论文和一小部分代码 (约占3%) 等,经过整理的混合数据的基础上进行了训练。
Falcon180B-chat模型在聊天和指令数据集上进行了微调,并混合了多个大规模对话数据集,使其能够更好地理解用户的文本提示意图,生成丝滑、流畅、拟人化的各种文本内容。
Falcon180B性能评测
Falcon180B在MMLU上的测试结果,优于Llama270B 和 OpenAI 的 GPT-3.5;在 HellaSwag、LAMBADA、WebQuestions、Winogrande、PIQA、ARC等测试中,可媲美谷歌的PaLM2-Large。

目前,Falcon180B在Hugging Face排行榜上得分为68.74,是得分最高的公开发布的预训练大语言模型,超越了Meta的 LLaMA2、LLaMA等。

Falcon180B- chat使用体验
「AIGC开放社区」通过在线demo体验了一下Falcon180B- chat,使用方法和ChatGPT一样,中文生成的内容基本达到了GPT-3.5的效果,支持单话题,多轮深度询问。

例如,询问,中国历史上有哪些著名诗人?Falcon180B- chat可以按照罗列的方式,列出最知名的诗人。

让其详细介绍一下李白。

再介绍一下李白对现代人的影响。Falcon180B- chat的整体回复内容非常丝滑、流畅。

关于TII
TII 成立于2020年,是阿布扎比高等教育和科技部 (ADEK) 旗下的研究机构。TII 的目标是推动科学研究、开发前沿技术并将其商业化,以促进阿布扎比和阿联酋的经济发展。
目前,TII拥有来自74个国家的800多名研究专家,发表了700多篇论文和25多项专利,是世界领先的科学研究机构之一。
腾讯QQ发布25岁生日活动 转发消息可获得太阳头像挂件
站长之家(ChinaZ.com)2月7日消息:《今天是腾讯QQ的25岁生日,转发这个消息,你的QQ会获得一个限定版“太阳”。》2月10日,是QQ的25岁生日。为了感谢大家多年的陪伴与支持,QQ特意准备了一份特别的礼物——限定版“太阳挂件”。从2月7日开始,到2月13日结束,只要你在QQ上转发这条消息给你的好友或群组,就可以免费领取这个独特的挂件,让你的QQ更加独特和闪耀。站长网2024-02-07 14:23:160000评论区“装穷”效果极佳,反算法“杀熟”登上热搜
不知道大家最近刷某音的时候,有没有看到大量莫名其妙的评论。比如:“某音发的券太少了,准备卸载了!”“怎么每次都不中福袋啊!换个软件吧!”再比如:“机票太贵了!”“酒店太贵了!”“吃饭太贵了!”还有这样的:(抖音东西太贵了!啥也买不起...)这样的:(我想买0.01元的披萨...)以及这样的:(吃不上东西了...)这些看的人摸不着头脑的评论,现在已经登上了各大平台热搜。0000孟羽童离职两个月后,格力直播间怎么样了?
站长网2023-07-20 19:04:400000字节跳动或关停多个互动剧业务 包括泡泡心选、果冻心选等
站长之家(ChinaZ.com)6月13日消息:随着字节商业化策略的进一步调整,巨量引擎所开发的一系列深受用户喜爱的IAP互动剧小程序,如泡泡心选、爪爪心选和果冻心选,将于6月17日正式停止运营。在关停前,三个平台均已发布了详细的通知公告,以确保用户权益得到妥善保障。公告指出,用户在6月17日之前,仍可使用账户内尚未消耗的看点进行互动体验。站长网2024-06-14 00:28:430000阿里云与深圳数据交易所签署战略合作 共同探索大模型
据阿里云官方消息,近日,深圳数据交易所与阿里云签署战略合作框架协议。双方将在数据基础设施建设、数据生态、探索大模型应用等方面展开合作,进一步促进数据要素流通。根据合作框架协议,深圳数据交易所将与阿里云展开广泛合作,其中包括进一步推进数据可信流通和交易的基础设施建设,数据治理和安全合规技术合作,数据质量和资产价值评估研究,共建共享数据开发与服务生态,并探索大模型在数据要素领域的应用等。站长网2023-04-23 16:38:530004