智源团队Aquila2-34B双语对话模型推出Int4量化版本

站长网2023-10-24 21:25:100阅

智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀，超过了其他全球开源模型，包括 LLama-70B 等。

同时，Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型，仅次于 GPT4。

为了降低使用大模型的门槛，智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中，从而显著降低了34B 级别大模型的训练和推理所需的资源。

经过 Int4量化，AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗，提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合，通过4位量化和 Low Rank Adapters （LoRA）方法进行微调，从而实现在不损失模型性能的情况下节省内存和提高训练速度。

据悉，Aquila2-34B 系列模型已经在国产芯片上进行了适配，并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术，用户可以在低资源环境中运行大参数模型。

项目地址：

https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py

智源团队Aquila234B双语对话模型推出Int4量化版本

0000

评论列表

共(0)条

相关推荐

站长资讯
日本凸版公司着眼于人工智能， 4亿美元投资芯片和电子产品
日本印刷和材料集团凸版控股（ToppanHoldings）计划在三年内向其电子领域投资约600亿日元(4亿美元)，以寻求从人工智能驱动的半导体行业增长中获利。总裁兼首席执行官HideharuMaro表示，这一数字比前三年增加了100亿日元，占凸版2023-25财年计划增长投资的30%。凸版的目标是，与2022财年的水平相比，将用于芯片封装的FC-BGA基板的产能提高一倍。
站长网2023-11-25 14:10:05
0004
站长资讯
大模型浪潮澎湃，带给普通人哪些价值？
新世纪的头个十年，朴树的《NEWBOY》在大街小巷回响，互联网在国内野蛮生长，枝繁叶茂出了以三大门户网站为首的互联网企业。彼时国际奥委会主席萨马兰奇宣布“BEIJING”成为2008年奥运会主办城市后，中华世纪坛欢声雷动，天安门广场人如潮涌。而后搜狐率先拿下北京奥运会的转播权，一时间，“看奥运，上搜狐”挂满了路边的公交车身。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2023-10-30 16:41:39
0000
站长资讯
GPT-4o 17人Omni金牌团队首揭秘！清北上交中科大6位华人领衔
几天前的发布会上，OpenAI再次向全世界证明，它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真，那一刻，全世界为之振奋。就在刚刚，GPT-4o的关键团队信息，也被公布了出来。就是这个名为「omni」的团队，发挥出了不可思议的潜力，让OpenAI的首个原生全多模态模型成为可能。
站长网2024-05-17 09:05:37
0000
站长资讯
iPad Pro/Air双剑齐发！苹果发布会仅35分钟
快科技5月6日消息，据爆料人MarkGurman透露，苹果将于5月7日举行的发布会预计仅持续35分钟，届时将推出4款新品:iPadPro、iPadAir、ApplePencil和妙控键盘。其中新款iPadPro将提供11英寸和12.9英寸两种尺寸，首次采用OLED屏幕，支持LTPO技术和120HzProMotion显示，采用双串联结构，具有高亮度、长寿命和更好的电池续航表现。
站长网2024-05-06 10:54:54
0000
站长资讯
新文生图模型PIXART-δ:引入ControlNet，加速文本生成图像生成
划重点:🚀PIXART-δ整合LatentConsistencyModels（LCM）和ControlNet，实现高效实时图像生成。🔬创新ControlNet-Transformer设计，提升对Transformer模型的控制性能。⚙️采用LatentConsistencyDistillation（LCD）提高训练效率，支持低内存GPU。
站长网2024-01-17 14:28:25
0000