孟子3-13B大模型正式开源
澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。
孟子3-13B大模型基于Llama架构,经过高达3T Tokens的数据集训练,该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。
项目地址:https://github.com/Langboat/Mengzi3
为了便于用户快速部署和使用,澜舟科技提供了简单的两步操作。首先,用户需要进行环境配置,通过pip命令安装必要的依赖。随后,用户可以通过提供的代码快速开始使用模型,进行基础的交互推理。此外,澜舟科技还提供了样例代码和模型微调的相关文件和代码,以便用户根据自己的需求进行定制和优化。
澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景,并在实践中发现,ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发,这一参数规模范围的模型既能满足场景需求,又具有高性价比。因此,澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。
孟子3-13B大模型的开源,是澜舟科技在大模型领域的又一重要里程碑。去年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2对公众开放。现在,感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。
随着孟子3-13B大模型的开源,澜舟科技进一步巩固了其在AI大模型行业的领先地位,并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。
金融大模型,在黎明破晓前丨祛魅AI
8月31日,首批大模型产品将陆续通过《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)备案,可正式上线面向公众提供服务。包括百度文心一言、抖音云雀大模型、智谱AI的GLM大模型、中科院的紫东太初大模型、百川智能的百川大模型、商汤的日日新大模型、MiniMax的ABAB大模型、上海人工智能实验室的书生通用大模型、科大讯飞星火大模型,以及华为、腾讯的大模型产品,共计11家。站长网2023-09-01 14:01:250000Top3厂商COO,如何看待一年增长80倍的短剧出海?
短剧出海继续狂奔。今年4月,第三方数据公司Appfigures公布了今年第一季度短剧出海成绩单。整个Q1海外短剧品类累计营收2.45亿美元,相比去年同期增长了80倍,市场规模迅速扩大。同时发布的品类榜单显示,ReelShort、DramaBox和ShortMax在下载和营收两个维度上大幅领跑同类产品。2024Q1海外短剧下载/收入排行榜(ShortTV站长网2024-08-02 14:29:550000Meta公布Llama 3训练集群细节!储备60万块H100迎接AGI
【新智元导读】LLM开源从Infra做起!Meta公布了自己训练Llama3的H100集群细节,看来Llama3快来了。每年3月份,照例各家大厂又要开始秀自己最新的产品和研究了。OpenAI刚刚发布了震惊世人的Sora,最新的ChatGPT版本似乎也是箭在弦上。谷歌更是举全公司之力,从去年底就开始放出了包括GeminiUltra,Gemini1.5,Gemma在内,各分支赛道上的惊艳成果。站长网2024-03-15 17:02:460000阿布扎比推出人工智能公司 A171,与 OpenAI 竞争
划重点:🔸阿布扎比推出人工智能公司A171,将与OpenAI等AI研究公司展开竞争。🔸A171是阿布扎比技术创新研究所(TII)领导的广泛人工智能研究和开发项目的成果。🔸A171将专注于市场营销和支持Falcon大型语言模型(LLM),该模型是TII今年早些时候推出的。00007天B站涨粉20万,“猫meme”为何风靡全网?
“猫meme”正在入侵互联网。最近,一个名为“ねこのつぶやき”(猫的自言自语)的日本UP主在B站走红,短短半个月涨粉超27万。这位UP主是一名单亲妈妈,她分享了自己来中国生活后价值观发生变化的故事,不过她并没有真人出镜,而是加入了各种好玩的猫咪表情包进行视频剪辑,做成了“猫meme”版vlog。比如在去中国的飞机上,刚出生不久的孩子猛哭两小时,这里配上双手抱头尖叫的小奶猫表情;站长网2024-03-15 15:09:250000