胜率达94.08%!李开复Yi-34B最新成绩超过LLaMA2等主流大模型
要点:
李开复的Yi-34B-Chat模型在多个评测中取得显著成绩,胜率达94.08%,超越主流大模型如LLaMA2和ChatGPT。
该模型在加州大学伯克利分校主导的LMSYS ORG排行榜中以1102的Elo评分追平GPT-3.5,展现强大性能。在中文能力评测中,Yi-34B-Chat在SuperCLUE排行榜上以31.82%的对战胜率仅次于GPT4-Turbo。
Yi-34B-Chat的成功得益于零一万物团队的AI Alignment团队采用创新对齐策略,包括轻量化指令微调方案、多能力融合、对数据的关注等。
近期,李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYS ORG排行榜中,以1102的Elo评分追平了GPT-3.5。此外,在中文SuperCLUE排行榜上,Yi-34B-Chat以31.82%的胜率仅次于GPT4-Turbo。
通过对话场景实测,Yi-34B-Chat在不同对话场景中展现出优越的实力。从对Transformer模型结构的发展方向到生成小红书文案,Yi-34B-Chat的回答均显示其有理有据,符合当前主流风格。在中文理解方面,Yi-34B-Chat在复杂的中文理解问题上也展现了出色的精准性。

项目地址:https://huggingface.co/01-ai
Yi-34B-Chat模型的卓越表现不仅仅源于其强基座系列,还得益于人工智能对齐团队的创新对齐策略。采用轻量化指令微调方案,单项能力提升和多项能力融合两个阶段的创新训练方式,以及关注数据质量和指令多样性等方面的独特设计,使Yi-34B-Chat在各方面均有出色表现。
Yi-34B模型开源首月表现亮眼,在Hugging Face社区下载量高达16.8万,魔搭社区下载量也达到1.2万,GitHub上获得超过4900个Stars。多家知名公司和机构基于Yi模型基座推出的微调模型,如猎户星空公司的OrionStar-Yi-34B-Chat模型、IDEA研究院的SUS-Chat-34B等,性能表现优异。在GPU加速大模型的实验中,Yi-6B成为范例项目。
开发者Eric Hartford提出Yi模型使用了与LLaMA模型相同的架构,引发了一场关于“抄袭”的质疑。零一万物团队意识到问题,及时在各开源平台重新提交模型及代码,完成了版本更新。然而,这一小问题在国内被曲解,引发了一场舆论风暴。团队强调,他们是从零开始打造Yi系列模型,重新命名仅为对比实验需求。
这一系列的成绩和问题共同勾勒出Yi-34B-Chat模型的成功轨迹,尽管受到一些质疑,但其在技术创新和用户体验方面的表现仍然备受瞩目。
北京星动纪元公司发布Xhand机械手 能撸猫能拿鸡蛋
北京星动纪元公司近期发布了一款名为Xhand的先进机械手,它具备12个主动自由度和内置的触觉传感器,能够实现高度精确的控制。这款机械手的性能令人印象深刻,它能够像人类一样温柔地抚摸猫咪、精确地操作剪刀、轻松地拿捏鸡蛋,以及执行各种复杂的任务。站长网2024-05-17 16:39:080002马斯克梭哈xAI,叫板OpenAI
历时四个月,全球最大超级计算中心“Supercluster”正式开始运转。埃隆·马斯克在社交平台公开宣布,美国时间7月22日凌晨4:20,由xAI、X和英伟达等合力打造的“Supercluster”已开始投入训练。它由10万块H100组成,是目前世界上最强训练集群。站长网2024-07-27 11:36:220000AI刷好评!亚马逊充斥着ChatGPT等AI工具生成的虚假评论
人工智能生成的虚假评论正对亚马逊电商平台制造混乱。除了多年来一直困扰该网站的虚假评论之外,卖家已经开始使用ChatGPT等工具在电子商务平台上刷好评论。站长网2023-04-27 11:26:090000接不接DeepSeek?互联网大厂的新天问
接不接DeepSeek?正在成为腾讯、百度、阿里、字节等大厂决策层面临的新天问。在后厂村、海淀黄庄、未来科技城、滨海大厦、TIT创意园……无数有关DeepSeek的问题被提出,一些与路线有关的决策被制造。很快,这些决策就被传导到用户面前:0000官宣:余承东出任华为智能汽车解决方案BU董事长
快科技9月22日消息,就在昨天,多家媒体报道称华为智能车业务迎来重大调整,余承东不再担任华为智能汽车解决方案BUCEO一职,升任车BU董事长,接替他的是华为光产品线总裁靳玉志,华为内部已对上述调整进行了内部发文。站长网2023-09-22 21:02:330000