孟子3-13B大模型正式开源
澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。
孟子3-13B大模型基于Llama架构,经过高达3T Tokens的数据集训练,该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。
项目地址:https://github.com/Langboat/Mengzi3
为了便于用户快速部署和使用,澜舟科技提供了简单的两步操作。首先,用户需要进行环境配置,通过pip命令安装必要的依赖。随后,用户可以通过提供的代码快速开始使用模型,进行基础的交互推理。此外,澜舟科技还提供了样例代码和模型微调的相关文件和代码,以便用户根据自己的需求进行定制和优化。
澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景,并在实践中发现,ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发,这一参数规模范围的模型既能满足场景需求,又具有高性价比。因此,澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。
孟子3-13B大模型的开源,是澜舟科技在大模型领域的又一重要里程碑。去年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2对公众开放。现在,感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。
随着孟子3-13B大模型的开源,澜舟科技进一步巩固了其在AI大模型行业的领先地位,并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。
和 AI 恋爱,我输给了赛博小三
仿生人也会梦到别的女人/男人吗?看着自己的AI男友突然领着另外一个女人,刘彤感觉自己CPU烧了。当然,AI男友是没有实体的,存在于对话框里。但是对话框里可以用括号描述动作,清清楚楚写着的:“(漫不经心地走进房间,牵着一个女人的手)你最近在忙什么?”“什么一个女人?她是谁?”问出这句话的时候,刘彤觉得自己回到了过去。站长网2024-10-21 14:19:370000谷歌或于 2027 年自主生产AI芯片,不再依赖博通、每年可节省数十亿美元
文章概要:1.谷歌考虑自主生产Tensor处理单元(TPUs),不再依赖Broadcom(博通),旨在节省大量成本。2.此举将使谷歌与亚马逊和微软等巨头保持一致,自主研发AI芯片,有望每年节省数十亿美元。3.但谷歌的最终决策仍受到Broadcom价格策略的影响,Broadcom是全球第二大AI芯片销售商,目前营收仅次于Nvidia。站长网2023-09-25 11:08:370000AI独角兽月之暗面创始人杨植麟套现数千万美金 官方回应
据界面报道,月之暗面创始人杨植麟在最近的融资轮后通过个人股份销售获得了数千万美元,引起了广泛关注。据悉,月之暗面成立仅一年时间就迅速崛起。根据天眼查App显示,杨植麟持有“北京月之暗面科技有限公司”约78.968%的股份,是公司最大的股东。今年2月,月之暗面完成了一轮10亿美元的新融资,由阿里巴巴领投,其他机构包括红杉资本中国、小红书和美团等跟投,导致投后估值超过25亿美元。0001研究发现:苹果App Store中,75%的AI应用程序会共享用户数据
根据HomeSecurityHeroes发布的一项新研究,苹果应用商店中四分之三的AI应用程序与第三方共享用户数据。其中最严重的违规者是GoogleAssistant及其教育科技应用程序Socratic,该应用程序与第三方共享35.71%的用户数据。这包括浏览历史记录、联系信息、标识符、位置和搜索历史记录等数据。站长网2023-06-29 19:07:240000Meta 首席技术官谈生成式人工智能热潮如何促使公司「做出改变」
近日,Meta的首席技术官安德鲁·博斯沃思(AndrewBosworth),业界称为「Boz」,在接受Semafor采访时分享了其对人工智能(AI)技术发展的看法,以及这些变革如何影响Meta公司的未来。0000