浏览器就能跑大模型了,陈天奇团队发布WebLLM,无需服务器支持
现在,只需一个浏览器,就能跑通“大力出奇迹”的大语言模型(LLM)了!
不仅如此,基于LLM的类ChatGPT也能引进来,而且还是不需要服务器支持、WebGPU加速的那种。
例如这样:

这就是由陈天奇团队最新发布的项目——Web LLM。
短短数日,已经在GitHub上揽货3.2K颗星。

一切尽在浏览器,怎么搞?
首先,你需要下载Chrome Canary,也就是谷歌浏览器的金丝雀版本:
因为这个开发者版本的Chrome是支持WebGPU的,否则就会出现如下的错误提示:

在安装完毕后,团队建议用“终端”输入如下代码启动Chrome Canary:
/Applications/Google\Chrome\Canary.app/Contents/MacOS/Google\Chrome\Canary—enable-dawn-features=disable_robustness

启动之后,便可以来到官网的demo试玩处开始体验了。
不过在第一次展开对话的时候,系统还会出现一个初始化的过程(有点漫长,耐心等待)。

机器学习编译(MLC)是关键
接下来,我们来看一看Web LLM如何做到“一切尽在浏览器”的。
根据团队介绍,其核心关键技术是机器学习编译(Machine Learning Compilation,MLC)。
整体方案是站在开源生态系统这个“巨人肩膀”上完成的,包括Hugging Face、来自LLaMA和Vicuna的模型变体,以及wasm和WebGPU等。
并且主要流程是建立在Apache TVM Unity之上。

团队首先在TVM中bake了一个语言模型的IRModule,以此来减少了计算量和内存使用。
TVM的IRModule中的每个函数都可以被进一步转换并生成可运行的代码,这些代码可以被普遍部署在任何最小TVM运行时支持的环境中(JavaScript就是其中之一)。
其次,TensorIR是生成优化程序的关键技术,通过结合专家知识和自动调度程序快速转换TensorIR程序,来提供高效的解决方案。
除此之外,团队还用到了如下一些技术:
启发式算法:用于优化轻量级运算符以减轻工程压力。int4量化技术:用来来压缩模型权重。构建静态内存规划优化:来跨多层重用内存。使用Emscripten和TypeScript :构建一个在TVM web运行时可以部署生成的模块。……
上述所有的工作流程都是基于Python来完成的。
但Web LLM团队也表示,这个项目还有一定的优化空间,例如AI框架如何摆脱对优化计算库的依赖,以及如何规划内存使用并更好地压缩权重等等。
团队介绍
Web LLM背后的团队是MLC.AI社区。
据了解,MLC.AI 社区成立于2022年6月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。

值得一提的是,该团队此前还做过Web Stable Diffusion,链接都放在下面了,赶快去体验吧~
Web LLM体验地址:https://mlc.ai/web-llm/
Web Stable Diffusion体验地址:https://mlc.ai/web-stable-diffusion/
参考链接
[1]https://twitter.com/HongyiJin258/status/1647062309960028160
[2]https://github.com/mlc-ai/web-llm
iQOO与NBA签约:Neo9系列将于12月27日发布
iQOO手机与NBA中国近日举行签约仪式,宣布双方达成合作伙伴关系。据悉,iQOONeo9系列将于12月27日(本周三)19:00正式发布,拥有红白魂”、航海蓝”和格斗黑”等多彩配色,满足不同消费者的个性化需求。在核心配置上,Neo9系列搭载了高性能处理器,为用户带来流畅的使用体验。iQOONeo9系列还配备了自研电竞芯片Q1,为玩家们带来高清、细腻、低时延的游戏视效。0000互联网大厂,花名不能停
网友夏机智在抖音分享了自己入职阿里后艰难的“取花名”经历:“在起花名的入职流程卡了两天,正常的不正常的名字全试了,还是取不出来。”作为最早开创花名文化的大厂,阿里至今仍保留着入职需要取花名的传统。时至今日,阿里已经拥有超过20万名员工。此前那些人尽皆知的武侠宗师的名号早已轮不上普通员工,即使是一个相对普通的花名,可能也已被人捷足先登。站长网2024-02-27 14:09:120000高通推出用于 XR 和 AR 平台的下一代芯片
高通今日发布了适用于XR和AR平台的最新芯片:SnapdragonXR2Gen2和AR1Gen1。此次发布标志着高通在XR领域的进一步发展。站长网2023-09-28 10:18:230000DeepSeek上脸实测:AR眼镜实时翻译老黄GTC演讲,完了还帮我划重点
DeepSeek、通义千问等大模型AR眼镜,打开GTC老黄演讲的姿势,可以是这样:翻译的字幕就在眼前,根据演讲实时更新。还能一键总结摘要:△实测为演讲部分内容,并非全文只凭一副看上去平平无奇的眼镜,就能随身带一个翻译官助手。摘下眼镜,立刻回归现实。同时也可以是一个随身携带,随时可直接唤醒的AI助手。提问一句,什么是相对论?专业回答立刻浮现眼前。站长网2025-03-23 19:35:070001Sora时代:长视频走进“迷雾剧场”?
“扔进一部小说、出来一部大片”。这并不是科幻,而是AI即将带给整个内容行业的一点点震撼。Sora火了,也引发了不少讨论也有一些做影视的朋友们惊呼:“Sora要革影视行业的命”。流浪地球的导演,中国科幻电影的“扛把子”郭帆也发朋友圈感慨,技术的发展太快了。站长网2024-02-20 18:10:260000