中文聊天模型Llama3-8B-Chinese-Chat发布 减少中英混答的问题
站长网2024-04-23 15:15:072阅
Llama3-8B-Chinese-Chat 是一个基于 Meta-Llama-3-8B-Instruct 模型,通过 ORPO(无参照整体优选优化)方法进行微调的中文聊天模型。该模型在处理中文问题时,相较于原始模型,减少了使用英文回答和混合中英文回答的情况,同时减少了表情符号的使用,使得回答更加正式和专业。
ORPO 是一种优化模型偏好和性能的方法,它利用赔率比(Odds Ratio)的概念来调整模型的偏好设置,无需明确正确答案即可优化模型在特定任务中的表现。在 Llama3-8B-Chinese-Chat 模型中,ORPO 被用来优化模型对中文和英文的生成偏好,减少生成英文答案的倾向,以更好地适应中文对话环境。
模型的训练细节包括使用 DPO-En-Zh-20k 英汉数据集,经过3个周期的训练,学习率设置为5e-6,并采用余弦调度器调整。模型的上下文长度限制为8192字符,全局批次大小为64,使用的优化器为 paged_adamw_32bit,ORPO 参数(β)设置为0.05。
在实际应用中,Llama3-8B-Chinese-Chat 模型能够更准确地理解中文问题的意图,并以更恰当的方式响应。例如,它能够避免在回答中文问题时错误地使用英文或不必要的表情符号,提供更正式和专业的回答。
模型还展示了在安全和道德方面的应用,当用户提出不当请求时,模型能够坚持原则,拒绝提供有害或非法的信息,并引导用户参与安全和合法的活动。
此外,Llama3-8B-Chinese-Chat 模型在数学问题解答、写作和编程示例方面也表现出色,能够提供清晰、准确的解答和示例代码。
模型下载地址:https://top.aibase.com/tool/llama3-8b-chinese-chat
0002
评论列表
共(0)条相关推荐
微软画图或将引入AI画图功能,支持文本转图像
据WindowsCentral报道,微软可能会在Windows11上的微软画图中引入基于AI的新功能,其中包括支持用户通过文本描述生成图片的能力。消息人士告诉WindowsCentral,AI功能将由Bing的ImageCreator背后的相同技术提供支持,该工具可以根据您的描述生成图像。您可以在WindowsCentral发布的内部模型中看到集成的外观。站长网2023-08-23 12:45:320000三位OpenAI掌舵人亲自撰文:我们应该如何治理超级智能?
【新智元导读】现在是开始思考如何治理超级智能的好时机——未来的AI系统将比通用人工智能(AGI)更强大。AI,从来没有像今天这样,如此广泛地影响着人类的生活,以及给人类带来如此多的担忧和麻烦。像所有以往其他重大技术革新一样,AI的发展亦有两面,一面向善,一面向恶,这也是当前全球各国监管机构开始积极介入的重要原因之一。0000腾讯以最「离谱」的方式,成了年度赢家?
前两天,2023年的TGA(TheGameAwards)奖项正式出炉,米哈游《崩坏:星穹铁道》喜提最佳移动游戏;腾讯和拳头的《英雄联盟》《无畏契约》也成功包揽了TGA的所有电竞奖项。0000讯飞华为官宣联手:国产大模型只有基于自主创新算力底座才有大未来
讯飞华为,竟悄然已在大模型上联手?!一个算法软件,一个硬件芯片,两个国产代表性公司已经选择强强联合。事情是酱婶的。我去世界人工智能大会(WAIC)逛展来到华为展区,结果却看到了科大讯飞的星火大模型。一开始还以为是展台摆错了,了解之后才知道是华为和科大讯飞联手了。这下双厨狂喜。而且不光他俩,现场还发现了很多这样的合作伙伴……来到国产大模型主场站长网2023-07-10 09:51:590000微软宣布为商业客户提供新的 Copilot 版权承诺:将承担潜在法律风险
微软公司周四表示,如果使用其人工智能产品的客户因生成内容而被起诉侵犯版权,该公司将承担法律责任。微软将承担由第三方提出的任何索赔所带来的潜在法律风险,只要该公司的客户使用其产品中内置的「防护措施和内容过滤器」。它提供了功能以减少AI返回侵权内容的可能性。随着生成式AI(计算机程序能够生成文本、图像、声音等数据)的广泛应用,用户对这种技术无需参考原作者即可生成内容产生了担忧。站长网2023-09-08 09:19:310001