Stability AI 开源聊天机器人 Stable Chat 采用新的「解释微调」技术
站长之家(ChinaZ.com) 8月30日消息:Stability AI 是图像生成 AIStable Diffusion 的开发商,其最近推出了开放访问的语言模型 Stable Beluga 的基于 Web 的聊天界面 Stable Chat。在发布时,Stable Beluga 是 HuggingFace 排行榜上表现最好的开放大型语言模型(LLM)。
Stable Beluga 基于 Meta 发布的 LLaMA 基础模型,并使用由 GPT-4 生成的合成数据集进行微调。最大的Stable Beluga 模型包含 70B 个参数,在多个基准测试中优于 ChatGPT,包括 AGIEval,该测试基于 LSAT 和 SAT 等常见考试。为了帮助评估Stable Beluga,Stability AI 创建了Stable Chat Web 界面来帮助用户与模型交互并对其输出提供反馈。根据 Stability AI:
作为我们在构建世界上最值得信赖的语言模型方面所做努力中一部分,我们已经设置了一个仅用于研究目的网站来测试和改进我们技术。随着我们研究迅速进展,我们将继续更新新模型。请避免将此网站用于实际应用或商业用途。
Stable Beluga 模型受到微软关于 Orca 论文启发而产生,该论文介绍了一种称为解释微调(explanation tuning)的技术。像指导微调(instruction tuning)一样,最近许多开放 LLM 都使用了这种技术,包括 ChatGPT 和 Vicuna。
解释微调使用由教师生成的示例输入和期望模型输出的数据集。在 ChatGPT 的情况下,教师是实际使用该模型的人类用户。相比之下,在 Orca 和 Stable Beluga 中,解释微调数据集是通过提示 GPT-4 解释为什么会生成它所做出的输出来生成的内容。
Stability AI 创建了自己的 600,000 个示例组成的解释微调数据集——只有微软数据集大小十分之一。然后他们训练了两个版本 Stable Beluga:基于 65B 参数原始 LLaMA 模型的 Stable Beluga 1 和基于 70B Llama 2 模型的 Stable Beluga 2。两者均以非商业许可证发布。尽管这些模型在发布时在排行榜上取得第四名和第一名,但目前基于 LLaMA 进行微调模型已经推动 Stable Beluga 2 退出前十名,并将 Stable Beluga 1 甩到更低位置。
根据 Stability AI 公司表示,这些模型以非商业许可证发布旨在鼓励研究人员协作迭代并改进技术。然而,该公司指出,这需要超出普通研究人员的资源,并决定创建 Stable Chat 网站。用户可以创建免费登录或使用 Google 帐户访问聊天界面。模型的响应可以被投票、反对或标记;这些用户反馈将用于未来改进模型。
另外,Stability AI 最近还宣布他们的 LLM 将在 DEF CON 31 举办的 AI 红队活动中使用。此次活动由白宫赞助,涵盖了「Anthropic, 谷歌, Hugging Face, 微软, 英伟达, OpenAI 和 Stability AI」,目标是帮助识别模型中的风险和漏洞。
访问 Stable Chat:
https://research.stability.ai/chat
微信规范公众号标题夸大营销行为 将根据违规程度做出处罚
今日,微信官方发布《关于规范公众号标题夸大营销的公告》称,近期,平台发现部分创作者为了提高阅读量,故意将文章标题的描述混淆为官方通知,用震惊、严肃的词语来夸大紧急程度和影响面,吸引用户点击进入,实际正文为与标题不相关的营销广告内容,并不是标题所说的通知或新闻。这种行为容易给用户产生误导,损害了用户的阅读体验,对平台内容生态造成不良影响。站长网2024-02-28 15:45:300001扎克伯格:到 2024 年 AI 将成为 Meta 最大的投资领域
站长之家(ChinaZ.com)10月27日消息:Meta公司在周四的股票收盘价下跌了超过3%,这主要是在该公司发布了强劲的第三季度财报后的次日,由于持续的以色列-哈马斯战争可能导致广告业务放缓,公司对此表达了谨慎的看法。站长网2023-10-27 11:00:000000抖音即时零售开启招商,外卖业务“秽土转世”
2月,抖音外卖划入电商线4个月后,迎来新的变化。光子星球独家获悉,日前,抖音电商商家端“抖店·到家”页面以邀测方式向部分商家开放即时零售入驻,预计最快将于7月14日正式上线。商家移动端方面,目前PC端只提供连锁版商家入驻,而移动端提供单店版。一位知情人士透露原兼管外卖业务的商业化销售副总裁浦燕子在一个月前另有任用,疑似将负责即时零售业务。站长网2024-06-29 22:14:300001DeepMind的新研究:人类最后的自留地失守了?
AI对人类世界的学习能力,到目前为止仍然停留在语言层面。喂给大模型语料——最初是维基百科和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。也因此有生成式AI的创业者认为,一个极度聪明的大语言模型就是那个通往AGI最终答案,多模态的研究道路只是目前对前者的底气不足。0000研究:人类参与提升了公众对AI的接受度
划重点:1.增加人类参与提高了AI在公共服务中的接受度。2.研究显示市民不仅关注AI的公平性,还担忧潜在的人类偏见。3.具体的系统特征,如高准确性、上诉系统、透明度增加、成本降低、数据不共享以及没有私人公司的参与,都增加了市民对AI的接受度和程序公平感。一项新研究表明,增加人类参与对公共服务中使用的人工智能(AI)可以提高对该技术的接受度。站长网2023-11-01 11:39:390000