小米发布大语言模型MiLM-6B 参数规模64亿

站长网2023-08-11 14:59:410阅

近日，小米发布了大规模预训练语言模型MiLM-6B ，参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

据悉，在 C-Eval 评估中，MiLM-6B 的平均分为60.2，在 STEM、Social Sciences、Humanities 和 Others 等不同学科和难度级别上也表现出色。

在 CMMLU 评估中，MiLM-6B 在 zero-shot 和 five-shot 测试中的平均分分别为60.37和57.17，表现出良好的知识和推理能力。

目前，该模型相关信息还在不断更新中。

项目地址：https://github.com/XiaoMi/MiLM-6B

小米发布大语言模型MiLM6B 参数规模64亿

0000

评论列表

共(0)条

相关推荐

我们决定用50个关键词，来总结2024这AI狂奔的一年。
2024，在AI历史上，注定是个风起的一年。我一直在想，究竟怎么给这一年，做一个有用、有趣、还具有代表性的总结。直到两周前，我去深圳调研，跟@腾讯研究院的朋友一起吃了顿饭，在饭局上，我们聊起这个事，他们说，他们也要做，他们本身就想用50个关键词，给2024年做一个很全面的总结。只花了5分钟，我们就决定，那不如，就一起做吧。于是，两周过去，就有了今天这么一份非常精美的技术图景报告。
站长网站长资讯2025-01-06 14:22:49
0000
站长资讯
单月涨粉466万，“撒币玩家”在抖音风生水起
抖音11月涨粉榜已出，我们先一起看榜:10月，我们见证了剧情达人@大圆哥以787.9W的绝对优势位居涨粉榜榜首，为“沉寂已久”的内容生态注入了一丝活力。而时间来到11月，像@大圆哥这样的超级黑马并未出现，登上榜首的@户外发（东方阿保）增粉量为466.3W，与@大圆哥有着300W的涨粉差距。
站长网2023-12-15 13:58:09
0000
站长资讯
从指向 ChatGPT 到 xAI：AI.com 域名真正所有者仍然未知
今年2月，OpenAI似乎购买了AI.com，并将其重定向到ChatGPT的网页界面，引发了一些争议。但是，现在前支持者、Twitter拥有者和X爱好者埃隆·马斯克似乎已经接手了这个有价值的域名，或者其他人代表他接手了：AI.com现在重定向到亿万富翁的人工智能和机器学习研究机构X.ai。站长工具WHOIS查询
站长网2023-08-04 11:47:21
0000
ControlNet大更新：仅靠提示词就能精准P图，保持画风不变，网友：效果堪比定制大模型
StableDiffusion插件、“AI绘画细节控制大师”ControlNet迎来重磅更新:只需使用文本提示词，就能在保持图像主体特征的前提下，任意修改图像细节。比如给美女从头发到衣服都换身造型，表情更亲和一点:抑或是让模特从甜美邻家女孩切换到高冷御姐，身体和头部的朝向、背景都换个花样儿:——不管细节怎么修改，原图的“灵魂”都还在。除了这种风格，动漫类型的它也能驾驭得恰到好处:
站长网站长资讯2023-05-16 09:11:12
0002
站长资讯
34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%
【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」，面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点，在各种黑科技的加持下，开源模型的推理性能依然不够看。最近，滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.
站长网2023-09-19 18:18:51
0000