智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B
站长网2023-10-12 13:56:250阅
智源研究院发布了最强开源中英双语大模型 —— 悟道・天鹰340亿 (Aquila2-34B)。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。
同时,智源研究院还发布了开源全家桶,包括 Aquila2模型系列、语义向量模型 BGE 的新版本、FlagScale 高效并行训练框架、FlagAttention 高性能 Attention 算子集。这些开源项目将促进大模型研究的协同创新。
据悉,Aquila2-34B 基座模型在综合能力方面超越了 Llama2-70B 和其他开源基座模型。AquilaChat2-34B 对话模型在综合评测中领先,而 AquilaChat2-7B 在同量级对话模型中取得最佳成绩。AquilaChat2-34B 在推理能力方面仅次于 GPT4。AquilaChat2-34B-16K 通过扩展上下文窗口长度到16K,在长文本任务中取得了领先水平。
此外,智源团队还开发了 NLPE 方法来提升模型的外延能力。AquilaSQL 成为最优的文本 - SQL 语言生成模型。智源研究院还发布了 FlagScale 高效并行训练框架和 FlagAttention 高性能 Attention 算子集,进一步推动大模型研究的发展。
Aquila2模型全系开源地址:
https://github.com/FlagAI-Open/Aquila2
https://model.baai.ac.cn/
https://huggingface.co/BAAI
0000
评论列表
共(0)条相关推荐
一个人在家卖零食,带货10W+。
各位村民好,我是村长。一个人在家拍抖音,也能带货10W。如果要问对于普通人来说,在抖音拍什么最简单且有机会带货成功,那我推荐你做零食带货号。一个人在家就能拍,关键成本还极低。01零食可持续的大赛道首先说一下,为什么要选择零食这个产品赛道。其一,人群受众广,零食是典型满足三高特点的赛道:高人群、高消耗、高转化。从三四岁幼儿园小孩子到七八十岁老人,许多产品大家都能吃。站长网2023-05-23 11:17:010000Jua筹集1600万美元,构建自然界AI模型、从气象预测开始
##划重点:1.**项目概要:**瑞士初创公司Jua筹集1600万美元,致力于构建自然界基础人工智能模型,首要应用领域为气象预测。2.**独特之处:**Jua声称其模型比Google的GraphCast等同类模型更为强大,数据规模更大,将不仅局限于天气预测,而是涵盖更广泛的物理问题和挑战。站长网2024-02-06 10:39:190000B站报告:近一年AIGC相关视频播放量超20亿
今年以来,AIGC概念非常火爆,有很多国内用户会在B站平台去了解AIGC相关内容和知识。根据B站发布《2022环境、社会及管治报告》(ESG报告),显示近一年内(2022年4月1日至2023年3月31日)B站AIGC相关视频播放量超20亿。站长网2023-05-12 20:33:430000零一万物Yi-VL多模态语言模型上线 包括Yi-VL-34B、Yi-VL-6B两个版本
零一万物Yi-VL多模态语言模型是零一万物Yi系列模型家族的新成员,它在图文理解和对话生成方面具备卓越的能力。Yi-VL模型在英文数据集MMMU和中文数据集CMMMU上都取得了领先成绩,展示了在复杂跨学科任务上的实力。站长网2024-01-23 09:17:510000从VR试妆到AI应用,Lazada的东南亚爆品方法论
2018年9月,李佳琦成功挑战“30秒涂口红最多人数”的吉尼斯世界纪录,并成为涂口红的世界纪录保持者。随后的双十一”,李佳琦与马云在直播间PK卖口红,秒表摁下,李佳琦卖出了1000支口红,自此李佳琦“口红一哥”的称号再无人与之争锋。在东南亚头部电商平台Lazada内部也有一个无人与之争锋的“口红一哥”,他不是靠涂口红成名,而是靠黑科技让在线涂口红不再失真。0000