李开复零一万物公司回应大模型争议:承认模型结构基于GPT结构
要点:
1. 李开复旗下公司「零一万物」的大模型 Yi-34B 引发争议,因研究者发现其基本采用 LLaMA 架构,但只是对两个张量进行了重命名。
2. 有关该模型的性能和成就,包括上下文窗口大小超过200k、一次处理40万汉字、在 Hugging Face 全球开源模型排行榜中获得双料冠军等。
3. 在社区中有人指出,Yi-34B 实际上是对 LLaMA 代码的一次重构,但未作实质性改变,引起对虚假宣传、许可证违规等问题的疑虑。公司回应表示基于 GPT 结构,并在模型训练中遇到的一些需求导致了代码重命名。
最近,「零一万物」公司旗下的大模型 Yi-34B 因使用 LLaMA 架构但改变张量名引发争议。这一争议中,研究者指出其代码实际上是对 LLaMA 代码的一次重构,只是未作实质性改变。社区担心这可能违反了许可证规定,且未经过框架支持的外部代码附加可能存在安全风险。
Yi-34B 的成就在开源大模型领域引起了广泛关注,其上下文窗口大小超过200k,能处理40万汉字,成为全球开源模型双料冠军。然而,争议的核心在于其是否真正符合 LLaMA 的许可协议,以及对模型代码的更改是否属于虚假宣传。
在社区的讨论中,有人提到模型的性能参数和配置存在疑虑,包括模型被标榜为32K 模型实际上配置为4K 模型的问题。此外,对于模型的微调数据和基准测试的信息也没有充分提供,引起了社区的疑虑。
「零一万物」公司回应称,他们的模型结构基于 GPT 成熟结构,但在训练实验中由于需求对代码进行了更名。他们强调模型的结构只是其中一部分,投入了大量研发工作在数据工程、训练方法、评估方法等方面,这是他们在大模型预训练阶段的核心技术护城河。最后,他们表示尊重社区的反馈,将代码进行更新以更好地融入 Transformer 生态。
综合来看,争议集中在「零一万物」公司的 Yi-34B 模型是否违反了开源协议,以及其在性能参数和代码修改上的透明度。这一事件提醒开源社区对于模型的合规性和透明度的重要性,同时也反映了在开源领域中公司的技术选择可能引发广泛关注和争议的现实。
面对AI音乐恐慌,人类艺术家们决定反抗
从ChatGPT全球爆红开始,各种AI翻唱开始涌现。在国外,AIRihanna开始演唱Beyonce的歌,AIKanye正在翻唱PlainWhiteT's《HeyThereDelilah》;在国内,B站上的AI王心凌正在唱《套马杆》,AI孙燕姿正在唱《七里香》。站长网2023-04-26 09:20:210000京东再次成为春晚独家互动平台 发放价值15亿红包
京东将在2024年再次成为央视春晚的独家互动合作平台。据悉,京东App将在春节期间设置特别的“春晚主会场”,推出总价值约15亿元人民币的红包、现金奖品、汽车等实物奖品。这些奖品不仅限国内用户,京东也在内部讨论如何实现奖品的海外包邮。据一位接近央视的人士透露,要成为春晚独家互动平台,企业需要至少投入数亿元的赞助费。京东此次并非春晚的唯一合作平台,小红书已经宣布成为春晚的笔记和直播分享平台。站长网2024-01-24 09:54:000000苹果iOS 18隐藏功能曝光!任何文本框中都可进行数学计算
快科技6月16日消息,苹果公司在2024年的全球开发者大会(WWDC)上推出了iOS18的开发者测试版,尽管官方已经展示了诸多新功能,但一些用户和开发者还是发现了一些未被广泛宣传的隐藏特性。近日,有用户发现,iOS18现在允许用户在任何文本框中直接进行数学计算,而无需打开计算器应用。站长网2024-06-17 04:50:130000三星 Galaxy Z Fold 5 和 Flip 5 基于人工智能的数字变焦算法或通过软件更新下放至 Galaxy S23 系列
最新的三星可折叠设备GalaxyZFlip5和Fold5可能没有突破性的升级,但它们巩固了三星在可折叠硬件领域的领导地位。站长网2023-07-31 17:59:040000微软 Bing 聊天 6 月份重大更新可能包括对 Chrome、Firefox 等第三方浏览器的实验性支持
微软在其Build2023开发者大会上宣布了一些即将推出的Bing聊天新功能。其中包括支持从各种合作伙伴添加第三方插件。事实证明,BingChat团队正在准备在6月份的一次重大更新中添加对这些插件的支持。微软的广告与网络服务负责人MikhailParakhin在Twitter上回答了关于Bing聊天改进的一些问题时提供了这些信息。他表示:站长网2023-05-31 15:29:090000