基于Llama 2的日语LLM发布,参数量达70亿、可与GPT3.5匹敌
文章概要:
1. ELYZA发布了基于Meta的Llama2的日语LLM「ELYZA-japanese-Llama-2-7b」,参数数量达到70亿,性能媲美GPT3.5。
2. 该模型经过追加事前学习和独特的事后学习,性能在5级手动评估中获得最高分,尽管还未达到封闭型LLM的水平,但已经与GPT3.5相匹敌。
3. ELYZA成功地将英语等其他语言的LLM能力引入日本语,并通过减少日本语学习量来改进Meta的Llama2基础上的模型。
最近,日本的人工智能初创公司ELYZA宣布发布了一款基于Meta的「Llama2」的日本语言模型(LLM),该模型被命名为「ELYZA-japanese-Llama-2-7b」,拥有70亿参数。此举使得该模型能够与开放AI领域的巨头GPT3.5相媲美。
为了达到这一性能水平,ELYZA采用了多重学习策略。首先,他们进行了日本语的追加事前学习,然后进行了独特的事后学习。此外,通过增加日本语词汇表,他们实现了模型的高速化,进一步提高了性能。这一系列措施使得「ELYZA-japanese-Llama-2-7b」成为一个强大的日本语言模型。
性能方面,ELYZA使用了「ELYZA Tasks100」数据集,进行了5级手动评估。评测时,三人进行盲测,隐藏型号名称、打乱顺序,通过得分平均来计算分数。
结果显示,「ELYZA-japanese-Llama-2-7b-instruct」在与其他已公开的日本语模型进行比较时,获得了最高分。虽然它还没有达到闭源LLM的水平,但已经能够与GPT3.5相匹敌。
值得注意的是,ELYZA在模型的开发中采用了一种聪明的方法,将其他语言的LLM能力引入到了日语中,从而减少了日语学习的难度和成本。这一策略为模型的性能提升做出了重要贡献。
ELYZA的「ELYZA-japanese-Llama-2-7b」模型标志着日本语LLM领域的一项重要突破。虽然目前在参数数量上仍不及一些国际级模型,但这一进展为日本语自然语言处理和生成领域带来了更多可能性,未来可望进一步提高日本语LLM的性能。
对话千万GMV视频号玩家:商业化进入2.0时代,商家疯抢公域流量
“自8月视频号发布新规‘直播间、首页、短视频置顶链接不能加企微’,相对收紧公私域联通通道后,视频号就已经进入商业化2.0时代。”或许是因为身兼千万GMV知识博主、卖货主播和亿级服务商、MCN主理人等多重身份,又是产品经理出身,润宇更习惯从流量角度看待视频号。在他看来,8月新规之前,视频号是以私域流量为核心的商业化1.0时代,8月新规之后,视频号将进入以公域流量为核心的商业化2.0时代。站长网2023-09-25 22:09:570000Relevance AI:让每个团队都拥有自己的AI同事
澳大利亚初创公司RelevanceAI推出了一款低代码平台,旨在帮助企业建立自定义AI团队,提高生产力。该平台已成功筹集1000万美元的A轮融资,由KingRiverCapital领投,全球投资者PeakXV、GalileoVenture和InsightPartners等参与。站长网2023-12-12 10:19:050000比亚迪入选《时代周刊》“最具影响力100家企业”榜单:世界上最重要的车企
快科技6月23日消息,美国《时代周刊》(TIME)近日公布了第三届2023年全球最具影响力100家公司榜单,评选出最有影响力的100家企业”(2023TIME100MostInfluentialCompanies),比亚迪再次成功入选,并且是连续三年登上该榜单。站长网2023-06-24 14:17:040000苹果回应iPhone15Pro沾指纹变色:可擦去
iPhone15Pro钛合金边框在今年成为了引人注目的升级点,不仅让手机更加轻便,还保持了坚固的强度。然而,一些用户发现,指纹可能会导致边框变色。苹果官方网站的一份最新支持文档中,对此做出了说明。苹果承认,指纹确实可能导致iPhone15Pro钛合金边框变色。然而,这种变色并非永久性的。苹果强调,只要进行简单的清洁,就可以让边框恢复原本的色泽。站长网2023-09-22 10:03:130000HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架
要点:结构感知的SDS引入人体结构先验,同时优化外观和几何形状。通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。站长网2023-12-11 09:59:090000