Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术
站长之家(ChinaZ.com) 8月30日消息:Stability AI 是图像生成 AIStable Diffusion 的开发商,其最近推出了开放访问的语言模型 Stable Beluga 的基于 Web 的聊天界面 Stable Chat。在发布时,Stable Beluga 是 HuggingFace 排行榜上表现最好的开放大型语言模型(LLM)。

Stable Beluga 基于 Meta 发布的 LLaMA 基础模型,并使用由 GPT-4 生成的合成数据集进行微调。最大的Stable Beluga 模型包含 70B 个参数,在多个基准测试中优于 ChatGPT,包括 AGIEval,该测试基于 LSAT 和 SAT 等常见考试。为了帮助评估Stable Beluga,Stability AI 创建了Stable Chat Web 界面来帮助用户与模型交互并对其输出提供反馈。根据 Stability AI:
作为我们在构建世界上最值得信赖的语言模型方面所做努力中一部分,我们已经设置了一个仅用于研究目的网站来测试和改进我们技术。随着我们研究迅速进展,我们将继续更新新模型。请避免将此网站用于实际应用或商业用途。
Stable Beluga 模型受到微软关于 Orca 论文启发而产生,该论文介绍了一种称为解释微调(explanation tuning)的技术。像指导微调(instruction tuning)一样,最近许多开放 LLM 都使用了这种技术,包括 ChatGPT 和 Vicuna。
解释微调使用由教师生成的示例输入和期望模型输出的数据集。在 ChatGPT 的情况下,教师是实际使用该模型的人类用户。相比之下,在 Orca 和 Stable Beluga 中,解释微调数据集是通过提示 GPT-4 解释为什么会生成它所做出的输出来生成的内容。
Stability AI 创建了自己的 600,000 个示例组成的解释微调数据集——只有微软数据集大小十分之一。然后他们训练了两个版本 Stable Beluga:基于 65B 参数原始 LLaMA 模型的 Stable Beluga 1 和基于 70B Llama 2 模型的 Stable Beluga 2。两者均以非商业许可证发布。尽管这些模型在发布时在排行榜上取得第四名和第一名,但目前基于 LLaMA 进行微调模型已经推动 Stable Beluga 2 退出前十名,并将 Stable Beluga 1 甩到更低位置。
根据 Stability AI 公司表示,这些模型以非商业许可证发布旨在鼓励研究人员协作迭代并改进技术。然而,该公司指出,这需要超出普通研究人员的资源,并决定创建 Stable Chat 网站。用户可以创建免费登录或使用 Google 帐户访问聊天界面。模型的响应可以被投票、反对或标记;这些用户反馈将用于未来改进模型。
另外,Stability AI 最近还宣布他们的 LLM 将在 DEF CON 31 举办的 AI 红队活动中使用。此次活动由白宫赞助,涵盖了「Anthropic, 谷歌, Hugging Face, 微软, 英伟达, OpenAI 和 Stability AI」,目标是帮助识别模型中的风险和漏洞。
访问 Stable Chat:
https://research.stability.ai/chat
AI编码无需人类插手!Claude工程师摔断右手,竟一周狂肝3000行代码
【新智元导读】一次意外右手骨折,Claude工程师的工作竟被AI挽救了。近两个月的时间,他们一起结对编程,甚至在一周内肝出3000行代码。他疯狂暗示,未来1-3年,就是「AI工程师」的天下。原来,摔断胳膊也是一件幸事......当事人表示,「我再也不想回到过去了」。这是为何?事情是这样的,几个月前,Claude工程师ErikSchluntz骑车上班的路上,意外摔断右手,打上了石膏。站长网2024-08-07 14:06:500000英伟达推文生图模型 ConsiStory:免训练、可生成连贯图片
划重点:⭐️英伟达和特拉维夫大学研究人员共同开发了一种免训练、可生成连贯图片的文生图模型ConsiStory。⭐️ConsiStory通过主体驱动自注意力(SDSA)和特征注入等核心模块,在不需要任何训练或调优的情况下实现图像主体的一致性。⭐️该模型还包含锚图像和可重用主体功能,提供主题一致性的参考,避免了传统训练方法中针对每个主题进行训练的难题。站长网2024-02-21 09:11:310001北大ChatLaw团队推出大模型恋爱神器Machine_Mindset 支持MBTI 16种人格
北大ChatLaw团队与FarReelAILab合作开发了一款大模型恋爱神器,可以让大模型具备MBTI16种人格,实现自由定制。用户可以选择不同的性格类型,使大模型在回答问题时展现出不同的个性化回应。这项工作通过构建十万条MBTI数据集,并采用多阶段预训练、微调和DPO训练方法,为大模型注入性格特征。站长网2024-01-15 17:03:000000人工智能正在融入高性能计算:促进医疗保健和医学的发展
站长之家(ChinaZ.com)10月12日消息:高性能计算(HPC)专为计算密集型工作负载而设计,正在帮助生命科学和医学研究人员更快、更经济高效地获得答案。当与加速计算、人工智能、高带宽内存(HBM)和其他先进内存架构相结合时,HPC正在为更快的药物发现研究提供动力。站长网2023-10-12 17:11:210000红米最强性能旗舰来了!Redmi K70至尊版现身:下月发布
快科技6月4日消息,海外博主在数据库发现了小米14T系列机型,设备型号为2406APNFAG。按照小米往年的策略,小米14T系列也就是国内的RedmiK70至尊版系列。RedmiK70至尊版上个月已经在国内入网,核心搭载联发科天玑9300芯片,是目前安卓阵营最强性能,也是Redmi历史最强性能。站长网2024-06-04 17:48:050000