OpenAI大神Karpathy纯C代码打造简化版Llama2 已获2.2K星
OpenAI的Andrej Karpathy(其在深度学习领域的贡献而闻名)创建了一个简化版的Llama2模型_Baby-Llama,并展示了在资源受限设备上使用纯C代码运行复杂模型的可行性。
创建Llama2模型
Karpathy测试了开源项目Llama2,他在纯C编程语言中将nanoGPT调整为Llama2架构,并通过开发C代码的推理引擎“run.c”来实现。该项目在GitHub上已经获得了2.2K star。
Karpathy的方法成功地实现了高度交互率,即使使用包含数百万参数的合理规模模型,并在TinyStories数据集的1500万参数模型上进行训练。他在M1MacBook Air上报告称,Llama2模型的推理速度为每秒约100个标记,在C代码中实现了这一结果,展示了在资源受限设备上运行复杂模型的可行性。
Karpathy的Baby-Llama方法受到了Georgi Gerganov的项目llama.cpp的启发,该项目几乎与使用C和C 在MacBook上运行第一个版本的LLaMA相同。他的方法涉及使用PyTorch从头开始训练Llama2LLM架构,并将模型权重保存到原始二进制文件中。接着,他写了一个名为“run.c”的500行C文件,加载保存的模型,并使用单精度浮点数(fp32)进行推理。这种简化的方法确保了较低的内存占用,并且不需要外部库,从而在单个M1笔记本电脑上高效执行,无需GPU。
小型LLM的崛起
模型逐渐变小的最大原因是为了在较小的本地设备上进行训练和集成。Karpathy的方法不仅不需要GPU,而且为单设备上的实现提供了案例。此外,Meta与芯片制造商Qualcomm合作,旨在使Llama2在本地硬件上运行,而苹果则推出了为Apple Silicon优化的Transformers架构。Karpathy已经展示了许多可能性。
Karpathy强调这个项目是一个周末实验,并不适用于生产级部署,主要目的是展示在资源受限设备上使用纯C代码运行Llama2模型的可行性,因为长期以来,C语言在机器学习中并不常用,因为它不涉及GPU。
项目网址:https://github.com/karpathy/llama2.c
李若彤领衔3大明星!《剑侠世界3》年度版9月7日公测
最新消息:西山居新一代剑侠情缘手游《剑侠世界3》今日官宣李若彤代言,年度版将于9月7日8:00正式公测。江湖挚友吕颂贤、李国麟降临剑侠江湖,助力新门派峨眉上线。当三大武侠明星与剑侠IP联手,将会碰撞出什么样的火花呢?峨眉现身江湖,十三大门派齐聚,却遭遇西域神秘番僧踢馆,峨眉掌门李若彤是否能携手各大门派侠客力挽狂澜?且看《剑侠世界3》年度版“峨眉争锋”大片预告。站长网2023-09-01 10:43:2000003D设计平台PixCap:AI驱动,支持调整和删除3D细节
Pixcap是一款由3D元素和AI驱动的图形设计工具。使用10,000多个3D元素来创建您理想的设计布局,然后使用我们的AI“造型师”在一个地方生成许多令人惊叹的设计变体。体验地址:https://pixcap.com/explore/packs站长网2023-08-11 11:08:290000今日AI:Sora超现实大片震惊好莱坞;IPadapter插件史诗级更新;苹果要推AI应用商店;DALL-E也推局部重绘功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事OpenAI联手视觉艺术家推大作首批7个Sora超现实大片震惊好莱坞【AiBase提要:】站长网2024-03-26 19:02:450001南大提出全新框架VividTalk 一张照片一段声音秒生超逼真视频
要点:南大等机构研究人员提出的通用框架,名为VividTalk,能通过一段音频和一张照片生成高质量、富有表现力的说话视频,实现口型和音频的无缝对齐。框架采用两阶段生成,第一阶段考虑面部运动和blendshape分布之间的映射,利用多分支Transformer网络建模音频上下文,第二阶段渲染内外表面的投影纹理,实现全面建模运动。站长网2023-12-13 17:27:490002vivo副总裁:AI大模型投入无上限,人才成本平均税后100万元
据界面新闻报道,vivo副总裁周围表示,vivo大模型现在每年20-30亿的投入成本,人才和设备各占一半,人才成本平均税后100万元。公司对大模型投入定义为高规格投入,目前没有设置上限。在今日的vivo开发者大会上,vivo正式发布自研通用大模型矩阵蓝心大模型。站长网2023-11-01 18:05:270000