迷你AI模型TinyLlama发布:高性能、仅637MB
划重点:
- 🚀 经过期待已久,TinyLlama项目发布了一款占用仅637MB的高性能AI模型。
- 📲 可在边缘设备上部署,也可用于辅助大型模型的推测解码。
- 🌐 TinyLlama是Meta开源语言模型Llama2的紧凑版本,性能优越,适用于多领域的语言模型研究。
经过一番期待,TinyLlama项目发布了一款引人注目的开源模型。该项目于去年9月启动,开发人员致力于在数万亿标记上训练一款小型模型。在经历了一些辛勤工作和一些挫折之后,TinyLlama团队如今发布了这个模型。这个模型有着10亿个参数,大约在训练数据上进行了三个时代,或者说是通过训练数据的三个循环。
TinyLlama的最终版本在性能上超越了现有规模相当的开源语言模型,包括Pythia-1.4B、OPT-1.3B和MPT-1.3B。这标志着一个里程碑,为语言模型领域的发展带来了新的可能性。
这款模型不仅仅是规模小,而且其优越性能使其成为部署在边缘设备上的理想选择,因为它仅占用637MB的存储空间。更令人振奋的是,TinyLlama还可以用于辅助更大型模型的推测解码,这为那些依赖大型模型的任务提供了更为灵活的解决方案。前特斯拉高级AI总监、现任OpenAI的Andrej Karpathy的教程被引用,强调了TinyLlama在这一领域的应用前景。
TinyLlama的团队在设计上将其打造成Meta开源语言模型Llama2的紧凑版本,甚至拥有相同的架构和分词器。这意味着它可以轻松地嵌入到基于Llama构建的项目中,为研究人员和从业者提供了一种“有吸引力”的平台,以进行语言模型研究。尽管规模小巧,TinyLlama展现出了在多领域语言模型研究中的广泛用途。
在实际应用中,苹果的机器学习研究科学家Awni Hannun通过使用MLX(苹果的开源训练工具套件)在8GB Mac Mini上对TinyLlama进行了LoRA微调,这显示了这款模型在各种场景下的灵活性和可塑性。团队表示,“凭借其紧凑的架构和出色的性能,TinyLlama可以在移动设备上实现最终用户应用,并成为测试与语言模型相关的创新想法的轻量级平台。”
随着TinyLlama的发布,团队表示他们计划推出“改进版本”,其中包括扩展其性能和多功能性的计划。这为未来的语言模型研究提供了更多的可能性。
这也是近来小型AI模型崛起的一个例证。一些公司开始关注制作规模相对较小但性能优越的模型,以降低硬件运行成本。微软的Phi项目就是其中之一,其Phi-2模型在尺寸上超过了25倍的模型,展现了小型模型的潜力。谷歌也宣布将推出的Gemini Nano,这是其新旗舰基础模型的小型版本,预计在尺寸上约为32亿参数。
这些小型模型在训练中使用更大模型生成的合成数据,从而在性能上表现出色。这一趋势正在推动着人工智能领域的创新,也使得许多小型模型在性能上能够与像OpenAI的GPT这样的前沿模型相媲美。
项目网址:https://github.com/jzhang38/TinyLlama
上海AI实验室开源工具箱XTuner 8GB显卡就可训练大模型
近日,上海人工智能实验室发布了一款面向大模型训练的开源工具箱XTuner,通过支持多种硬件适配,大幅降低了企业进行大模型训练的门槛,尤其是对中小企业具有重要意义。XTuner为各类开源模型提供了多样的微调框架站长网2023-09-20 10:19:030000王慧文再融16亿!大模型创业百天成独角兽,腾讯押注,快手创始人入股
美团老王再创业的第4个月,投资估值光速跻身独角兽。量子位最新获悉,美团联合创始人王慧文的AI创业公司光年之外,已在近期完成了新一轮2.3亿美元(折合人民币16.3亿)融资,投前估值10亿美元,进场百天,晋升独角兽。光年之外的本轮融资,据称由源码资本领投,押注8000万美元,此外腾讯、五源资本和快手创始人宿华均参与其中。站长网2023-06-05 21:29:360000微软宣布 Sam Altman 和 Greg Brockman 加盟,领导新的高级 AI 研究团队
微软公司的首席执行官SatyaNadella在周一表示,SamAltman、GregBrockman以及他们的许多前OpenAI同事将加入这家软件巨头。这一宣布标志着在AI初创公司的高管突然离职后,经过三天激烈讨论高潮的句号。站长网2023-11-20 16:29:510002900万人观看解清帅直播带货 同情的流量池能否装下变现的野心?
这两年舆论和关注度有一个统一的代名词叫做“流量”,当流量落在普通人身上时往往能带来命运的改变。因此趁着流量还在,开直播做带货已经成为社会常态。早前的张同学,去年的郑女士,今年的桃子老师、黄老师,都在关注度还不错的时候切入了直播带货业务。最近,又一位“名人”加入直播带货行列,他就是刚刚因“千万富翁”寻子被大家关注的解清帅。0000随处可见的“杨幂迪丽热巴”带货?AI直播卖货有钱途吗?
近日,众多媒体报道,多家电商AI换脸知名女星在直播间卖货,此事一经报道便引起广泛热议,值得关注的是,一部分网友感叹科技发展迅速,AI换脸的以假乱真,另一部分网友纷纷斥责商家的侵权越界行为,对直播电商的信任基石产生了动摇,还有一部分网友喊话平台和相关部门进行管控与整理,肃清直播电商的氛围。站长网2023-06-05 23:57:200000