智源团队Aquila2-34B双语对话模型推出Int4量化版本
站长网2023-10-24 21:25:100阅
智源团队最近发布了中英双语基础模型 Aquila2-34B 和中英双语对话模型 AquilaChat2-34B。这两个模型在中英双语主 / 客观综合评测中表现优秀,超过了其他全球开源模型,包括 LLama-70B 等。
同时,Aquila2-34B 在多项推理评测中超越了 LLama2-70B 和 GPT3.5模型,仅次于 GPT4。
为了降低使用大模型的门槛,智源 Aquila 团队将 Int4量化技术和 QLoRA 微调推理技术整合到 AquilaChat2系列模型中,从而显著降低了34B 级别大模型的训练和推理所需的资源。
经过 Int4量化,AquilaChat2-34B 模型能够用7B 量级模型相近的 GPU 资源消耗,提供超过 Llama2-70B 模型的性能。QLoRA 技术将量化技术与 LoRA 微调技术相结合,通过4位量化和 Low Rank Adapters (LoRA) 方法进行微调,从而实现在不损失模型性能的情况下节省内存和提高训练速度。
据悉,Aquila2-34B 系列模型已经在国产芯片上进行了适配,并成功进行了推理。通过使用 Int4量化和 QLoRA 微调技术,用户可以在低资源环境中运行大参数模型。
项目地址:
https://github.com/FlagAI-Open/Aquila2/blob/main/examples/predict_chat_quantize.py
0000
评论列表
共(0)条相关推荐
TikTok Lite 在欧洲暂停奖励功能 监管机构担忧其可能引发成瘾
据国外媒体报道,TikTok在欧洲推出的轻量级应用TikTokLite遇到了监管障碍。该应用程序包含一项奖励功能,允许用户通过观看视频、点赞等操作获得虚拟货币"硬币",并兑换亚马逊优惠券或贝宝礼品卡等物品。不过,欧洲监管机构对这一功能提出了担忧,认为它可能会导致用户特别是年轻人产生成瘾行为。根据欧盟《数字服务法案》,监管机构已经就此展开调查。站长网2024-04-25 20:00:390000仅次OpenAI!AI初创公司Inflection融资13亿美元 估值达40亿美元
日前,总部位于加州的AI初创公司Inflection宣布完成13亿美元的最新一轮融资,本次融资由微软、英伟达以及比尔·盖茨、埃里克·施密特、ReidHoffman(LinkedIn的创始人)牵头投资,英伟达也参与其中。站长网2023-06-30 19:48:450000猜 iPhone 16 “真高光”还是“挤牙膏”?苹果秋季发布会前瞻
上周二,苹果于凌晨正式官宣了今年秋季新品发布会的定档时间:将于北京时间9月10日凌晨1点,在加利福尼亚州库比蒂诺的总部举办特别活动,主题为“高光时刻(It'sGlowtime)”。站长网2024-09-03 17:07:220000圆心科技与腾讯健康合作 推出源泉患者管理大模型、惠保大模型
11月1日,腾讯健康与圆心科技举行战略合作签约,双方将以医疗大模型研发与应用为契机,推动圆心科技各业务板块的全面数智化升级。同时,圆心科技正式推出源泉患者管理大模型、惠保大模型。站长网2023-11-02 08:27:440000小鹏汽车进入法国市场 2024款小鹏G9将开启交付
5月16日,小鹏汽车在巴黎举行小鹏G9上市发布活动,正式进入法国市场,开启国际战略新篇章。2024款小鹏G9在法国售价区间为59990~73990欧元,折合人民币售价区间约为470000~580000元,计划今年7月开启交付。在当天活动现场,小鹏汽车还展出了小鹏G6,并计划于下个月在法国上市。站长网2024-05-17 15:36:370000