智源团队Aquila2-34B双语对话模型推出Int4量化版本
站长网2023-10-24 21:25:100阅
智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀,超过了其他全球开源模型,包括 LLama-70B 等。
同时,Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型,仅次于 GPT4。

为了降低使用大模型的门槛,智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中,从而显著降低了34B 级别大模型的训练和推理所需的资源。
经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。
据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。
项目地址:
https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py
0000
评论列表
共(0)条相关推荐
日本凸版公司着眼于人工智能, 4亿美元投资芯片和电子产品
日本印刷和材料集团凸版控股(ToppanHoldings)计划在三年内向其电子领域投资约600亿日元(4亿美元),以寻求从人工智能驱动的半导体行业增长中获利。总裁兼首席执行官HideharuMaro表示,这一数字比前三年增加了100亿日元,占凸版2023-25财年计划增长投资的30%。凸版的目标是,与2022财年的水平相比,将用于芯片封装的FC-BGA基板的产能提高一倍。站长网2023-11-25 14:10:050004大模型浪潮澎湃,带给普通人哪些价值?
新世纪的头个十年,朴树的《NEWBOY》在大街小巷回响,互联网在国内野蛮生长,枝繁叶茂出了以三大门户网站为首的互联网企业。彼时国际奥委会主席萨马兰奇宣布“BEIJING”成为2008年奥运会主办城市后,中华世纪坛欢声雷动,天安门广场人如潮涌。而后搜狐率先拿下北京奥运会的转播权,一时间,“看奥运,上搜狐”挂满了路边的公交车身。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-10-30 16:41:390000GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。就在刚刚,GPT-4o的关键团队信息,也被公布了出来。就是这个名为「omni」的团队,发挥出了不可思议的潜力,让OpenAI的首个原生全多模态模型成为可能。站长网2024-05-17 09:05:370000iPad Pro/Air双剑齐发!苹果发布会仅35分钟
快科技5月6日消息,据爆料人MarkGurman透露,苹果将于5月7日举行的发布会预计仅持续35分钟,届时将推出4款新品:iPadPro、iPadAir、ApplePencil和妙控键盘。其中新款iPadPro将提供11英寸和12.9英寸两种尺寸,首次采用OLED屏幕,支持LTPO技术和120HzProMotion显示,采用双串联结构,具有高亮度、长寿命和更好的电池续航表现。站长网2024-05-06 10:54:540000新文生图模型PIXART-δ:引入ControlNet,加速文本生成图像生成
划重点:🚀PIXART-δ整合LatentConsistencyModels(LCM)和ControlNet,实现高效实时图像生成。🔬创新ControlNet-Transformer设计,提升对Transformer模型的控制性能。⚙️采用LatentConsistencyDistillation(LCD)提高训练效率,支持低内存GPU。站长网2024-01-17 14:28:250000