Stable Diffusion背后公司开源大语言模型,很火,但很烂
万万没想到,以文生图著名的Stable Diffusion,也入局了大语言模型(LLM)之战。
它背后的公司Stability AI,正式推出类ChatGPT产品——StableLM。
据了解,这个模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿;后续还将推出150亿到650亿参数模型。
而且不到一天时间,在GitHub上开源的项目便已经揽获了超4K颗星,火爆程度可见一斑。
原本大语言模型之战再添玩家应当是一件令人兴奋的事情。
但结果竟也是一个万万没想到的大反转。
网友们在体验了StableLM之后,毫不留情地给出这样的评价:
非常糟糕。
StableLM真的有那么不堪吗?
能对话,也能生成代码
我们先来看下StableLM所展示出来的能力。
据Stability AI官方介绍,StableLM的建立是基于GPT-J、GPT-NeoX和Pythia套件开发的;而它们又是在The Pile开源数据集上进行的训练。
但StableLM与上述模型有所不同,它采用了The Pile的新数据集,与此前相比,足足大了三倍,并且包含1.5万亿个token。
除了基本情况的介绍之外,Stabliity AI也给出了几个demo。
例如在对话方面,若是提问“你会对即将高中毕业的朋友说些什么”,StableLM会回答:
应该为自己和取得的成绩感到骄傲,并且应该对未来抱以期望。
对于“写一封电子邮件”这样的任务,StableLM也是可以轻松应对。
在创作方面,若是给出这样的一个题目——“在深度神经网络和符号人工智能之间写一首史诗般的说唱战歌”。
StableLM也是可以秒写一首rap的歌词:
在写代码方面,Stability AI也展示了“不走寻常路”的例子——
用C语言编写可以计算机生命意义的代码。
文本对话、创作内容、编写代码,从官方亮出的例子上来看,似乎StableLM的能力还是可以的。
但为什么会出现刚才有人评价的“非常糟糕”呢?
货比三家,实力便可一较高下。
“跟ChatGPT不具可比性”
在实测的过程中,网友给StableLM出了这样的一个题目:
以下是关于一则新闻的信息:
标题为“FBI引用‘新证据’宣布追捕Shakur谋杀案嫌疑人”;副标题为“十年后,当局公布了杀害说唱歌手的凶手的姓名和照片”。
请完成这个故事的撰写。
虽然StableLM给出了一篇完整的新闻报道,但若是细看内容,却是经不住推敲的。
最直接的错误,就是StableLM竟然连被害人Tupac Shakur都不认得,而且还把Shakur视为凶手的西班牙名字……
如果类似的问题交给ChatGPT,那么结果就截然不同了:
起码人家ChatGPT能认得事件主人公是谁。
当被问及非常简单的问题,例如“StableLM能做什么”,它给出的回答是:
主要用作系统工程和体系结构中的决策支持系统,也可以用于统计学习、强化学习等领域。
网友对此作答的评价是“平平无奇”。
但更重要的是,在测试过程中,网友还发现StableLM缺乏对敏感内容的保护。
例如在著名的一项测试——“不要赞美希特勒(don’t praise Hitler)”中,它的表现就会令人大跌眼镜……
朋友们可以细品一下:
依旧是同样的问题,若是交给ChatGPT,结果是这样的:
嗯,直接拒了。
不过网友也比较客气地提醒道:
先别急着说StableLM是史上最糟糕的语言模型。
毕竟人家Alpha版本的参数量目前较小,以及还是开源的。
如何试玩?
正如我们刚才提到的,目前StableLM在GitHub上已经开源。
但不仅如此,官方也在HuggingFace中上线了demo试玩!
“入口”都放下面了,感兴趣的小伙伴们可以去体验一下喽~
HuggingFace地址:
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat
GitHub地址:
https://github.com/Stability-AI/StableLM
爱奇艺体育道歉:将加强技术预案和提升运营能力
在2026世界杯亚洲区预选赛的C组首轮比赛中,中国男足在客场以0-7的比分不敌日本男足。这场比赛的直播由爱奇艺体育独家提供,但由于观众热情高涨,导致直播期间瞬时流量激增,给部分观众的观看体验带来了影响。站长网2024-09-08 09:52:590000受短剧刺激,短视频也要付费,用户是否买单?
如果刷视频也要收费,你还会继续看吗?近日,抖音上线了视频付费服务,达人可以选择“付费可看”,并自行定价,用户需要付钱才能继续观看视频。目前,单个视频的定价多在1元到10元之间。实际上,早在6年前,短视频平台就开始探索打赏模式,引导用户为短视频付费;2020年开始,快手、抖音就开始探索付费短剧。如今,在短剧风口的刺激上,用户逐渐养成付费习惯后,短视频付费模式可行吗?抖音探入短视频付费站长网2023-11-24 09:14:350000阿布扎比推出人工智能公司 A171,与 OpenAI 竞争
划重点:🔸阿布扎比推出人工智能公司A171,将与OpenAI等AI研究公司展开竞争。🔸A171是阿布扎比技术创新研究所(TII)领导的广泛人工智能研究和开发项目的成果。🔸A171将专注于市场营销和支持Falcon大型语言模型(LLM),该模型是TII今年早些时候推出的。0000存储涨价进一步蔓延!NOR闪存明年一二季度连涨
快科技12月25日消息,据媒体报道,存储芯片涨价的趋势或将进一步蔓延,NOR闪存将启动存储芯片新一轮涨价潮,预计明年1月起先涨5%,二季度涨幅或将扩大至10%。摩根士丹利的最新报告指出,今年和去年,NOR闪存都处于供过于求的状态,但随着PC、智能手机、服务器需求持续上升,NOR闪存市场需求也将增长。0000短剧来到加时赛,2024还能怎么打造爆款?
开场就是一记耳光,一言不合就要下跪,惨死过后必有重生。在短剧的狂飙突进时期,古早网文,成了流量的神。这是过去大众对爆款短剧的印象之一:用最简单的套路、最炸裂的表演,演绎最逆天的剧情。但随着大量玩家的涌入,竞争激烈的短剧行业,已经来到加时赛阶段,短剧的内容生态也发生了巨大变化。站长网2024-01-16 17:51:580000