李开复零一万物公司回应大模型争议:承认模型结构基于GPT结构
要点:
1. 李开复旗下公司「零一万物」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。
2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。
3. 在社区中有人指出,Yi-34B 实际上是对 LLaMA 代码的一次重构,但未作实质性改变,引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构,并在模型训练中遇到的一些需求导致了代码重命名。
最近,「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中,研究者指出其代码实际上是对 LLaMA 代码的一次重构,只是未作实质性改变。社区担心这可能违反了许可证规定,且未经过框架支持的外部代码附加可能存在安全风险。
Yi-34B 的成就在开源大模型领域引起了广泛关注,其上下文窗口大小超过200k,能处理40万汉字,成为全球开源模型双料冠军。然而,争议的核心在于其是否真正符合 LLaMA 的许可协议,以及对模型代码的更改是否属于虚假宣传。
在社区的讨论中,有人提到模型的性能参数和配置存在疑虑,包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外,对于模型的微调数据和基准测试的信息也没有充分提供,引起了社区的疑虑。
「零一万物」公司回应称,他们的模型结构基于 GPT 成熟结构,但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分,投入了大量研发工作在数据工程、训练方法、评估方法等方面,这是他们在大模型预训练阶段的核心技术护城河。最后,他们表示尊重社区的反馈,将代码进行更新以更好地融入 Transformer 生态。
综合来看,争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议,以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性,同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。
微信下架微短剧黑莲花上位手册 因存在不良价值观
微信官方发布关于下架微短剧《黑莲花上位手册》的公告称,在专项治理期间,平台发现微短剧《黑莲花上位手册》渲染极端复仇、以暴制暴的不良价值观,混淆是非观念,破坏平台良好生态,平台已将该剧下架,现予以公示。对于存在上述违规内容和行为的小程序或账号,平台将引导整改,如提醒后仍未整改,将对违规内容及账号进行处置。站长网2023-11-21 16:31:330001阿里云推出AI视频生成工具Live Portait
阿里云最近在魔搭平台推出了一项新技术LivePortait,只要上传一张人脸照片,就可以用文字或语音控制,快速生成数字人AI视频!据了解,这项技术可以实现唱歌、Rap、说笑话等功能;还可以制作企业的数字形象名片;还支持多种语言和方言的智能播报和讲解等功能。现在,只要登录ModelScope官网,注册账号后,就可以进入创空间页面,选择示例输入,就可以马上生成视频并下载。站长网2023-08-17 09:02:180000腾讯云发布向量数据库 预计8月登陆腾讯云
今日,腾讯云正式发布了面向大模型训练的向量数据库(TencentCloudVectorDB),预计将于8月登陆腾讯云官网。腾讯云指出,向量数据库已经在多个业务场景中得到应用,包括QQ浏览器、腾讯视频、腾讯游戏、QQ音乐、搜狗输入法等30场景,并自研了分布式向量数据库核心引擎Olama,原名ElasticFaiss。站长网2023-07-04 17:13:050000昆仑万维:多模态大模型已进入实验性训练阶段
近日,昆仑万维表示,“天工”大模型自发布后一直以“周”为单位进行迭代,训练集群保持高负荷的运行。今年7月,手机端天工AI助手正式上线,进入内测阶段,苹果和安卓用户均可下载测试。目前,“天工”大模型已经具备强大的自然语言处理和智能交互能力,并展现出更高级的自主学习和智能涌现能力。站长网2023-08-31 15:41:050002国产大模型落地,等一个“Sora时刻”
仅凭几十个提示词,就能生成一段流畅完整、视角多元的视频,其内容质量几乎能以假乱真,甚至不亚于专业拍摄团队,这就是OpenAI首款文生视频产品Sora,一经发布便激起千层浪,让全球感受到新的AI震撼。2024年的AI故事,伴随着这款杀手级应用的横空出世拉开帷幕,Sora再度让所有人注意到了AI的无限可能性,为略显疲软的市场再打了一针鸡血。0001