小米发布大语言模型MiLM-6B 参数规模64亿
站长网2023-08-11 14:59:410阅
近日,小米发布了大规模预训练语言模型MiLM-6B ,参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。
据悉,在 C-Eval 评估中,MiLM-6B 的平均分为60.2,在 STEM、Social Sciences、Humanities 和 Others 等不同学科和难度级别上也表现出色。

在 CMMLU 评估中,MiLM-6B 在 zero-shot 和 five-shot 测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。
目前,该模型相关信息还在不断更新中。
项目地址:https://github.com/XiaoMi/MiLM-6B
0000
评论列表
共(0)条相关推荐
我们决定用50个关键词,来总结2024这AI狂奔的一年。
2024,在AI历史上,注定是个风起的一年。我一直在想,究竟怎么给这一年,做一个有用、有趣、还具有代表性的总结。直到两周前,我去深圳调研,跟@腾讯研究院的朋友一起吃了顿饭,在饭局上,我们聊起这个事,他们说,他们也要做,他们本身就想用50个关键词,给2024年做一个很全面的总结。只花了5分钟,我们就决定,那不如,就一起做吧。于是,两周过去,就有了今天这么一份非常精美的技术图景报告。0000单月涨粉466万,“撒币玩家”在抖音风生水起
抖音11月涨粉榜已出,我们先一起看榜:10月,我们见证了剧情达人@大圆哥以787.9W的绝对优势位居涨粉榜榜首,为“沉寂已久”的内容生态注入了一丝活力。而时间来到11月,像@大圆哥这样的超级黑马并未出现,登上榜首的@户外发(东方阿保)增粉量为466.3W,与@大圆哥有着300W的涨粉差距。站长网2023-12-15 13:58:090000从指向 ChatGPT 到 xAI:AI.com 域名真正所有者仍然未知
今年2月,OpenAI似乎购买了AI.com,并将其重定向到ChatGPT的网页界面,引发了一些争议。但是,现在前支持者、Twitter拥有者和X爱好者埃隆·马斯克似乎已经接手了这个有价值的域名,或者其他人代表他接手了:AI.com现在重定向到亿万富翁的人工智能和机器学习研究机构X.ai。站长工具WHOIS查询站长网2023-08-04 11:47:210000ControlNet大更新:仅靠提示词就能精准P图,保持画风不变,网友:效果堪比定制大模型
StableDiffusion插件、“AI绘画细节控制大师”ControlNet迎来重磅更新:只需使用文本提示词,就能在保持图像主体特征的前提下,任意修改图像细节。比如给美女从头发到衣服都换身造型,表情更亲和一点:抑或是让模特从甜美邻家女孩切换到高冷御姐,身体和头部的朝向、背景都换个花样儿:——不管细节怎么修改,原图的“灵魂”都还在。除了这种风格,动漫类型的它也能驾驭得恰到好处:000234B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%
【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。最近,滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.站长网2023-09-19 18:18:510000