浏览器就能跑大模型了,陈天奇团队发布WebLLM,无需服务器支持
现在,只需一个浏览器,就能跑通“大力出奇迹”的大语言模型(LLM)了!
不仅如此,基于LLM的类ChatGPT也能引进来,而且还是不需要服务器支持、WebGPU加速的那种。
例如这样:
这就是由陈天奇团队最新发布的项目——Web LLM。
短短数日,已经在GitHub上揽货3.2K颗星。
一切尽在浏览器,怎么搞?
首先,你需要下载Chrome Canary,也就是谷歌浏览器的金丝雀版本:
因为这个开发者版本的Chrome是支持WebGPU的,否则就会出现如下的错误提示:
在安装完毕后,团队建议用“终端”输入如下代码启动Chrome Canary:
/Applications/Google\Chrome\Canary.app/Contents/MacOS/Google\Chrome\Canary—enable-dawn-features=disable_robustness
启动之后,便可以来到官网的demo试玩处开始体验了。
不过在第一次展开对话的时候,系统还会出现一个初始化的过程(有点漫长,耐心等待)。
机器学习编译(MLC)是关键
接下来,我们来看一看Web LLM如何做到“一切尽在浏览器”的。
根据团队介绍,其核心关键技术是机器学习编译(Machine Learning Compilation,MLC)。
整体方案是站在开源生态系统这个“巨人肩膀”上完成的,包括Hugging Face、来自LLaMA和Vicuna的模型变体,以及wasm和WebGPU等。
并且主要流程是建立在Apache TVM Unity之上。
团队首先在TVM中bake了一个语言模型的IRModule,以此来减少了计算量和内存使用。
TVM的IRModule中的每个函数都可以被进一步转换并生成可运行的代码,这些代码可以被普遍部署在任何最小TVM运行时支持的环境中(JavaScript就是其中之一)。
其次,TensorIR是生成优化程序的关键技术,通过结合专家知识和自动调度程序快速转换TensorIR程序,来提供高效的解决方案。
除此之外,团队还用到了如下一些技术:
启发式算法:用于优化轻量级运算符以减轻工程压力。int4量化技术:用来来压缩模型权重。构建静态内存规划优化:来跨多层重用内存。使用Emscripten和TypeScript :构建一个在TVM web运行时可以部署生成的模块。……
上述所有的工作流程都是基于Python来完成的。
但Web LLM团队也表示,这个项目还有一定的优化空间,例如AI框架如何摆脱对优化计算库的依赖,以及如何规划内存使用并更好地压缩权重等等。
团队介绍
Web LLM背后的团队是MLC.AI社区。
据了解,MLC.AI 社区成立于2022年6月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。
值得一提的是,该团队此前还做过Web Stable Diffusion,链接都放在下面了,赶快去体验吧~
Web LLM体验地址:https://mlc.ai/web-llm/
Web Stable Diffusion体验地址:https://mlc.ai/web-stable-diffusion/
参考链接
[1]https://twitter.com/HongyiJin258/status/1647062309960028160
[2]https://github.com/mlc-ai/web-llm
6999元起卖爆!荣耀Magic V3系列打破近一年大折叠屏首销纪录
快科技7月21日消息,荣耀MagicV3、荣耀MagicVs3两款折叠屏旗舰于7月19日全渠道开售,售价6999元起。根据荣耀终端有限公司中国区CMO姜海荣发布的首销战报,荣耀MagicV3系列打破了过去一年大折叠屏首销日销量及销售额纪录。海报显示,对比对象为2023年7月20日至2024年7月19日上市的所有大折叠屏手机。站长网2024-07-21 14:12:060000网友热议网约车是否该增加油电车选项:有人吐槽电车晕车、不开空调
快科技3月16日消息,近日话题#网约车是否该增加油电车选项#引发网友热议。简单来说就是,在打车界面增加选择油车或电车的选项,给予用户更多的选择权,让他们根据自己的需求和偏好来选择车型,从而避免不必要的担忧。有网友表示,电动汽车的乘坐体验并没有燃油车那么好,很容易晕车!为了尽可能延长续航,网约车司机往往会将动能回收调到最高档,这样导致的晕车可能会更加严重一些!站长网2024-03-16 20:12:390000马斯克𝕏AI团队首批产品曝光 包括Grok和PromptIDE
要点:1.马斯克的𝕏AI团队首批产品曝光,包括Grok和PromptIDE,两者与AI信息检索和提示词工作站相关。2.这两个产品的信息源自推特博主@AsunaGilfoyle-e/acc,而且𝕏AI已提交了商标申请,增加了产品可信度。3.具体产品功能和细节仍不清楚,但商标描述表明它们将与AI、信息处理、软件开发等领域相关,至少有一个是在线网站。站长网2023-11-03 11:53:460000英特尔与 Synopsys 合作 共同开发芯片
文章概要:英特尔与Synopsys扩展了合作伙伴关系,共同开发一系列用于英特尔代工服务的知识产权(IP)。这一合作意味着Synopsys芯片设计工具将与在英特尔代工工厂设计的芯片兼容。合作旨在为英特尔代工服务的客户提供更强大的产品,通过为他们提供在英特尔3和英特尔18A工艺技术上的关键IP,这些是英特尔最先进的工艺技术之一。站长网2023-08-15 10:10:130000苹果Mac游戏模式来了,游戏PC厂商毫不CARE?
能打游戏,但一定打不好。在本月初举行的WWDC2023大会上,苹果公司正式发布了macOSSonoma,其中最大的变化,是「游戏模式」的到来。你没有听错,macOS也拥有了「游戏模式」。简单来说,macOSSonoma提供的「游戏模式」,可以在mac设备进行游戏时,更积极地调动CPU、GPU资源,使用户的体验更加完善。站长网2023-06-17 23:47:330000