20412

孟子3-13B大模型正式开源

站长网2024-04-06 14:20:430阅

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。

孟子3-13B大模型基于Llama架构，经过高达3T Tokens的数据集训练，该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练，使其中文能力得到显著提升，同时也具备了强大的多语言处理能力。

项目地址:https://github.com/Langboat/Mengzi3

为了便于用户快速部署和使用，澜舟科技提供了简单的两步操作。首先，用户需要进行环境配置，通过pip命令安装必要的依赖。随后，用户可以通过提供的代码快速开始使用模型，进行基础的交互推理。此外，澜舟科技还提供了样例代码和模型微调的相关文件和代码，以便用户根据自己的需求进行定制和优化。

澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景，并在实践中发现，ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发，这一参数规模范围的模型既能满足场景需求，又具有高性价比。因此，澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。

孟子3-13B大模型的开源，是澜舟科技在大模型领域的又一重要里程碑。去年3月，澜舟科技发布了孟子GPT V1（MChat），今年1月，孟子大模型GPT V2对公众开放。现在，感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。

随着孟子3-13B大模型的开源，澜舟科技进一步巩固了其在AI大模型行业的领先地位，并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用，为AI产业的进步贡献力量。

孟子313B大模型正式开源

0000

评论列表

共(0)条

相关推荐

站长资讯
抖音旗下剪映测试“Dreamina”AIGC工具可用于生成创意图片
据Tech星球报道，近日，抖音旗下的剪映应用正在测试一个名为“Dreamina”的AIGC工具，该工具属于文生图的创作领域。通过这个工具，用户可以根据一段文字生成四幅由AI生成的创意图，生成的图片可以保存下来，也可以重新生成。
站长网2023-11-10 08:54:34
0004
站长资讯
AIwechat-Vercel：无需服务器即可将AI功能集成到公众号中
AIwechat-Vercel是一款创新的微信公众号插件，它利用Vercel的ServerlessFunctions提供后端服务，使得用户无需自己管理服务器，只需一个可以绑定到Vercel的域名（无需备案），即可实现将AI功能集成到微信公众号中。项目地址：https://github.com/pwh-pwh/aiwechat-vercel
站长网2024-03-11 12:03:27
0000
2023 年 AI 助手的崛起，交互式人工智能将于 2024 年问世
2023年，ChatGPT、Bard和Llama等人工智能（AI）聊天机器人崭露头角，承诺将使世界变得更高效，但也可能导致数百万人失业。这些AI助手已帮助全球用户生成通常需要人类更多小时才能完成的内容。尽管如此，目前尚未发生大规模裁员。过去一年中，涌现出数十种专门用于应用编码、视频和图形内容制作或音乐创作的替代产品。聊天机器人的局限性
站长网站长资讯2023-12-26 11:47:00
0000
站长资讯
老牌国货翻红，“活力28”们不能只靠“泼天流量”
近几年，国货“回春”的案例时有发生。在国货情怀助推下，白象、蜂花、活力28、娃哈哈、鸿星尔克等国货品牌频频出圈，甚至有的品牌因此“起死回生”，重新进入消费者视野。品牌经历流量巅峰后，究竟能够留存多少消费者?那些被野性消费过的品牌如今怎么样了?国货情怀这张牌又该如何打?常态模式下，国货品牌是否能打?
站长网2024-06-25 11:35:09
0000
站长资讯
Gartner：ChatGPT推动了企业增加对AI的投资
自去年11月发布以来，ChatGPT已成为互联网上增长最快的产品，并促使谷歌、微软和亚马逊等公司在其产品中采用这一新兴技术。据Gartner称，围绕OpenAI的ChatGPT的巨大热议促使45%的企业增加了对AI的投资。
站长网2023-05-05 15:09:14
0001