为什么缩小大语言模型是生成式人工智能的未来?
站长网2023-08-15 14:50:020阅
本文概要:
1. 大型语言模型(LLM)在企业使用中存在明显挑战,而较小的语言模型则可以更好地适应企业需求。
2. 较小的语言模型可以在现有的安全环境中进行操作和训练,速度更快、准确性更高。
3. 较小的语言模型可以基于企业的敏感数据进行定制,与其他数据集结合使用,为企业提供更有价值的洞察力。
很多企业热衷于接入生成式人工智能,但像 ChatGPT 这样的大型语言模型 给企业使用带来了明显的挑战。本月的一项 研究 发现,75% 的组织正在考虑或已经实施生成式人工智能应用的禁令,理由是安全、隐私和其他问题。训练大语言模型的高昂成本也 被视为采用的重大障碍。

据报道,像 ChatGPT 这样的法学硕士 接受了超过1000亿个“参数”或决定模型行为的值的训练。这使得它们的建造和运营成本极其昂贵——训练 ChatGPT的估计成本 为400万美元。
为了从生成式人工智能中获得价值,未来的发展方向在于更小的语言模型,它们仅需要更少的时间和资源来维护,并且可以在企业的安全云环境中进行操作。较小的语言模型可以针对更窄的任务集进行优化,从而实现更快速和更准确的结果。
与公共 LLM 不同,较小的语言模型可以通过训练企业最敏感的数据进行定制,而无需将数据输入到公共 LLM 中,因此安全和隐私风险较低。这些较小的模型还可以结合第三方数据源,如经济数据、商品价格、天气等,为企业提供更全面的洞察力。
未来,可能会出现只有少数几个被广泛使用的基础 LLM,由 Meta、Google 和百度等技术巨头运营。较小的语言模型有着广阔的应用前景,可以在公司或部门级别提供有价值的洞察力,是释放生成式人工智能真正力量的关键。
0000
评论列表
共(0)条相关推荐
爽文短剧到底有多赚?到了横店我差点想入伙。
他,衣着寒酸,被众人鄙视,被妻子狂扇巴掌,被逐出家门。而今,三年之期已到,他不再隐忍。在大家惊诧下,他的真实身份被揭晓:龙王、修罗、战神、罗刹、药神、虎帅。。。称号包括且不限于以上六种。这就是2020年最火的短剧类型,赘婿。当年的歪嘴战神,靠耐克笑养活了一大票鬼畜区up,也让短剧这个概念彻底出圈。如今又是三年之期已到,短剧也已经摇身一变,成了最当红的炸子鸡。站长网2023-11-17 09:17:510001WPS逆袭微软Office背后 雷军揭秘:这是中国软件行业最励志的故事
快科技11月30日消息,日前雷军在武大130周年珞珈论坛演讲时提到,WPS是一个硬核的技术英雄梦想,是中国软件行业最励志的故事。WPS的逆袭,就是坚持的胜利。雷军表示,办公软件这样的大型商业软件,开发难度极高,目前全球主要就微软Office、金山WPS这两款。0000Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译,「不让任何语言掉队」
【新智元导读】MetaAI的NLLB-200登上Nature,「不让任何一门语言掉队」,能翻译200种语言的大模型获得Nature社论的盛赞——复兴了濒临灭绝的语言,但是Nature研究人员也郑重提醒Meta,必须将使用这些语言的社区也纳入进来,才会真正减缓语言的消亡。站长网2024-06-18 20:03:250000网信办发布关于加强自媒体管理的通知 加大对MCN机构管理力度
今日,中央网信办发布《关于加强“自媒体”管理的通知》提出,加大对“自媒体”所属MCN机构管理力度。通知称,网站平台应当健全MCN机构管理制度,对MCN机构及其签约账号实行集中统一管理。在“自媒体”账号主页,以显著方式展示该账号所属MCN机构名称。对于利用签约账号联动炒作、多次出现违规行为的MCN机构,网站平台应当采取暂停营利权限、限制提供服务、入驻清退等处置措施。以下为具体内容:站长网2023-07-10 17:07:030000高盛因生成式 AI 提升生产力而上调美国及多国长期 GDP 增长预估
高盛日前上调了美国和许多其他主要经济体的长期增长预估,因为预计在未来十年中,生成式人工智能(AI)将提升生产力。站长网2023-10-31 11:33:560000