智源团队Aquila2-34B双语对话模型推出Int4量化版本
站长网2023-10-24 21:25:100阅
智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀,超过了其他全球开源模型,包括 LLama-70B 等。
同时,Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型,仅次于 GPT4。
为了降低使用大模型的门槛,智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中,从而显著降低了34B 级别大模型的训练和推理所需的资源。
经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。
据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。
项目地址:
https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py
0000
评论列表
共(0)条相关推荐
法拉第未来被纳斯达克除名 FF宣布退市
站长之家(ChinaZ.com)4月30日消息:近日,贾跃亭旗下法拉第未来(FF)公司遭遇纳斯达克交易所的除名通知,起因是该公司未能满足纳斯达克上市的多项规定。站长网2024-04-30 13:03:060000特斯拉Model 3、Model Y 长续航版涨价 后者价格上调2500元
特斯拉中国宣布,Model3长续航版和ModelY长续航版的售价将进行调整。具体来说,ModelY全轮驱动长续航版的售价将从原先的29.99万元调整为30.24万元,上涨了2500元。同时,Model3长续航焕新版的售价也将从原先的29.59万元调整为29.74万元,上调了1500元。站长网2023-11-09 08:39:130000雷军称终于到了交作业的时候 小米SU7今晚发布
今晚19:00,小米汽车将揭开其首款车型小米SU7的神秘面纱,这款备受瞩目的车型在历经三年的精心打造后终于要与公众见面。站长网2024-04-06 14:14:000001谷歌宣布搜索领域领导层变动和 AI 领域结构调整
站长之家(ChinaZ.com)10月19日消息:谷歌日前宣布了对其知识与信息(K&I)团队的领导层变动,以及对Gemini团队的结构调整。站长网2024-10-19 07:47:140000字节大模型BuboGPT已开源 demo可玩
字节推出了一种新的大模型,名为BuboGPT,BuboGPT是一种先进的大型语言模型(LLM),能够将文本、图像和音频等多模态输入进行整合,并具有将回复与视觉对象进行对接的独特能力。它展示了在对齐或未对齐的任意图像音频数据理解方面的出色对话能力。项目地址:https://bubo-gpt.github.io/站长网2023-08-19 13:07:070006