OnnxStream:内存友好的机器学习推理引擎 可在树莓派Zero 2上运行Stable Diffusion 1.5
OnnxStream是一款专注于减少内存占用、提高推理效率的机器学习推理引擎。它的设计目标是在资源受限的环境中运行深度学习模型,如树莓派Zero2,该设备只有512MB的RAM。
通过OnnxStream,用户现在可以在这种低功耗设备上运行复杂的算法,这对于需要在移动环境中处理大量数据的用户来说是一个重大突破。
项目地址:
https://github.com/vitoplantamura/OnnxStream/tree/846da873570a737b49154e8f835704264864b0fe
目前,OnnxStream的源代码已经在GitHub上开源,任何感兴趣的用户都可以查看和使用。这一创新为在资源有限的环境中运行深度学习算法提供了新的可能性,对于技术爱好者和开发者来说是一个令人振奋的消息。
核心功能:
1. 内存占用极低:OnnxStream的最大特点之一是其出色的内存管理能力。它可以将内存占用降低到极低的水平,甚至可以在RAM只有512MB的树莓派Zero2上运行大型深度学习模型,如Stable Diffusion XL1.0。
2. 权重加载器:OnnxStream提供了权重加载器(WeightsProvider)的接口,用户可以根据自己的需求实现不同的权重加载逻辑。默认情况下,OnnxStream提供了两种加载器:DiskNoCache和DiskPrefetch,分别用于不缓存和预加载权重数据。
3. 注意力切片:在运行UNET模型时,OnnxStream支持注意力切片(Attention Slicing),这可以显著减少计算中的内存占用,从而使模型在资源受限的设备上运行更加顺畅。
4. 动态量化和静态量化:OnnxStream支持动态量化和静态量化,这有助于减少模型的内存占用,并提高推理速度。用户可以根据自己的需求选择不同的量化方式。
5. 跨平台支持:OnnxStream可以在多个平台上运行,包括Linux、Mac、Windows和Termux。它的跨平台性使得用户可以在不同的设备上灵活使用。
贾跃亭:早日回国是我最大梦想 还债之日就是回国之时
快科技4月25日消息,今天下午贾跃亭发布最新视频称:早日还债回国是自己的最大梦想,已偿还100多亿美金债务。造车成功并还债之日就是自己回国之时。以下是贾跃亭视频文字版:0000腾讯云全新AI绘画产品亮相 已开放超25种生成风格
腾讯云在2023上海国际消费电子技术展上展示了多款AI和GC(GeneralComputing)产品。其中,腾讯云智能展示了全新的AI绘画产品,它依托腾讯优图实验室自研的AI绘画模型,提供AI图像生成与编辑技术API服务,用户能够轻松地根据输入的文本或图片,智能创作出与输入信息相关的图像内容。站长网2023-10-13 15:47:060000研究人员开发AI攻击方法BEAST:可在一分钟内绕过LLM防护栏
**划重点:**1.🕵️♂️研究人员使用BEAST技术成功开发出一种能在一分钟内诱导大型语言模型(LLM)产生有害反应的方法。2.⚡️BEAST相较于基于梯度的攻击更快速,利用NvidiaRTXA6000GPU,48GB内存,一分钟GPU处理时间,成功率高达89%。站长网2024-02-29 11:27:360000我用AI卖废料,平台上线两年,成交3亿+美金 | 对话创始人
5月份的一个上午,通过谷歌出海加速器的引荐,我们认识了「再生博士」的创始人兼CEO谭天、以及此前我们从未了解过的全球废料回收行业。用谭天的话来说,这是一个暴利的冷门行业,很少被人关注,极强的信息壁垒让这个行业一直类似于“小农经济”在运行,而他希望借助于AI,把废料回收带入“工业经济”模式,让现在全球只被回收了不到20%的废料,再利用的比例再提升一些(尽可能提升到100%)。站长网2023-06-06 19:07:280004苹果称128GB的iPhone也有充裕空间:我们有云存储服务
苹果发布了一则新的宣传视频。视频中,他们强调即使是128GB的iPhone15也能轻松应对用户的日常存储需求,特别是通过购买iCloud云存储服务,用户可以轻松存储海量照片和视频。然而,按照苹果的这种宣传逻辑,128GB的iPhone15似乎已足够应对各种需求。但现实情况却是,仅仅一个微信应用,就可能让这128GB的存储空间捉襟见肘。站长网2024-03-19 10:22:550000