内部人士透露:OpenAI 很可能将 GPT-3.5 开源
OpenAI 很可能在未来几个月内发布其模型的权重。OpenAI 的 Andrej Karpathy 最近表示,所有这些对于转换器语言模型来说都是非常通用的。“如果 / 当 OpenAI 发布模型权重(我既不能确认也不能否认!),那么这里的大部分代码将非常相关。”
根据 OpenAI Karpathy 的说法,OpenAI 很可能会开源 GPT-3.5,他是深度学习领域的知名人物。需要注意的是,公司尚未正式宣布此事。这个对话是从 Twitter(现在是 X)的一个帖子中开始的,其中一个用户问 Karpathy 为什么一直在玩 Llama2,而不是为 OpenAI 构建 Jarvis。
这一新发展是在最近发布的 Baby Llama(又名 llama.c)的背景下的,Karpathy 在他最近的实验中探索了在单台计算机上运行大型语言模型(LLMs)的概念,这受到了 Meta 的 Llama2发布的启发。
Karpathy 表示,llama2.c 现在可以加载和推理 Meta 发布的模型。他进一步举了一个例子,即在云 Linux 服务器上的96个 OMP 线程上以大约3个标记 / 秒的速度推理最小的7B 模型,并且预计很快可以达到约300个标记 / 秒的速度。
此外,他表示,如果你可以让7B 模型以良好和交互性的速度运行,那么你可以在最小的 llama2.c 仓库代码中从 “从头训练的微模型” 到 “LoRA 微调的7B 基础模型” 进行转变(包括训练和推理)。可以实现更高的能力并使用更少的训练数据。
有趣的是,Karpathy 的方法的成功在于其能够以高度交互的速度运行,即使是包含几百万参数的合理大小的模型,并且是在一个包含1500万参数的 TinyStories 数据集的模型上训练的。
希望它能带回真正的 OpenAI,该公司最初是一家开源非营利公司,Karpathy 是最初的创始成员之一,在为开源社区做出贡献方面发挥了积极作用。
报告:2023年第一季度全球PC出货量同比下降28%
CounterpointResearch公布数据称,2023年第一季度,全球PC出货量为5,670万台,年同比下降28%,成为过去10年来,除2020年第一季度因新冠疫情爆发中断制造和生产外,出货量最低的季度。站长网2023-04-20 09:23:390000IBM 推出高效 LLM 基准测试方法,计算成本降低99%
划重点:⭐️IBM研究推出了一种创新的LLM基准测试方法,可以将计算成本降低99%。⭐️该高效方法利用微型化基准测试,显著减少了评估LLM所需的时间和金钱成本。⭐️新方法已经引起AI社区的关注,并被广泛采用,有望推动人工智能模型评估领域的快速发展。站长网2024-06-04 14:56:300000京东:超1亿用户选择在京东购买Apple产品 618期间iPhone最高优惠2150元
京东近日公布了令人瞩目的销售业绩,宣告已有超过1亿用户在京东平台上购买了Apple产品。更令人兴奋的是,为了庆祝这一盛事,京东特别推出了618大促活动,为全线苹果产品带来了前所未有的现货优惠。其中,备受瞩目的iPhone15Pro系列最高可享2150元的巨额优惠,而且通过以旧换新服务,消费者还能额外获得最高660元的补贴。站长网2024-05-30 09:25:550000浙大学霸创业,估值150亿,这家杭州独角兽即将IPO
继拉卡拉、银联商务、PingPong后,又一支付公司冲刺IPO。赴科创板上市计划搁浅两年后,国内数字支付解决方案提供商连连数字科技股份有限公司(以下简称“连连数字”)转而冲向港股,近期,连连数字再次更新港股IPO申报稿,中金、摩根大通为保荐人。站长网2024-01-27 07:52:410000OpenAI 首席执行官 Sam Altman 访问韩国 寻求鼓励人工智能发展
OpenAI的首席执行官SamAltman计划与韩国总统尹锡悦会面,韩国希望在人工智能领域鼓励国内竞争力。上个月,Altman横穿欧洲与议员和国家领导人会面,讨论人工智能的前景和威胁。本周,他前往以色列、约旦、卡塔尔、阿联酋、印度和韩国。Altman周五在与大约100家韩国初创企业会面时表示:「人们关注的焦点是不要扼杀创新,任何监管框架都必须确保这项技术的好处惠及全世界。」站长网2023-06-09 23:45:300000