高通展示在安卓设备上运行ControlNet 生成一张图仅需11.26秒
近日,高通在IEEE/CVF计算机视觉和模式识别年会上展示了在智能手机上运行生成式AI模型的进一步进展。
今年2月,Stable Diffusion在一台运行高通最新骁龙8Gen2芯片的智能手机上能够在不到15秒的时间内生成一张图片。当时这个时间被认为是创纪录的,但随后不久就被研究人员多次打破了。它可能类似于高通公司目前在智能手机上使用ControlNet生成图片。该公司使用15亿参数的图像到图像模型,从开始到完成的时间为11.26秒。
生成AI图像通常需要一台快速的计算机,根据高通展示的效果,通过优化硬件和软件,智能手机也可以完成这项工作。
虽然OpenAI和Midjourney为他们的图像生成器提供了专用服务器,并向客户收取费用,但Stable Diffusion也可以在硬件上运行。要在合理的时间内生成高质量的图像,计算机将需要一张不错的显卡。其他为AI计算优化的芯片设备,如苹果的硅芯片Mac或iPhone,也可以完成这项工作。针对这些系统的Stable Diffusion客户端已经有一段时间了。
现在,高通首次展示了在一款搭载其芯片的安卓智能手机上进行的Stable Diffusion图像生成。
据了解,高通骁龙8Gen2芯片于2022年底推出,预计将于今年搭载在各个制造商的高价位安卓智能手机,比如最近宣布的三星Galaxy S23。根据高通的说法,通过量化、编译和硬件加速,他们成功在该芯片上运行了Stable Diffusion。
基于Stable Diffusion的所谓图像生成器已经在谷歌应用商店上出现了。然而,这些只是依赖服务器计算能力的Web界面,因此需要互联网连接。而在智能手机上直接运行Stable Diffusion则不需要互联网连接,这会占用一些存储空间。
据称,一张512x512像素、经过20次推理处理的图像在高通芯片上仅需不到15秒。该应用程序还提供了修补、图像编辑、风格转换和超分辨率等功能。所有这些都可以在设备上离线使用。
Stable Diffusion是否会在安卓智能手机上广泛可用还有待观察。首先,高通的视频只是一个概念验证,目前还没有相应的应用程序,而且可能需要一款新的高端智能手机。
其次,像Midjourney和DALL-E2这样的商业替代方案在使用上更便捷,在付出较少努力的情况下能够获得更好的结果。然而,能够在智能手机上执行这些计算密集型任务的技术进步仍然是令人瞩目的。
作为全球第二大智能手机芯片制造商,高通已经多年来一直在探索人工智能。2018年,该公司宣布在其最新的智能手机芯片中优化了针对AI任务的"神经处理单元"。同年,该公司对人工智能初创企业投资了1亿美元。
2022年6月,高通通过其AI堆栈为更多多样化的AI应用铺平了道路,该堆栈结合了多个用于移动芯片(如智能手机、汽车或耳机中的芯片)开发的AI工具。据高通称,这里展示的Stable Diffusion应用程序也是使用AI堆栈在智能手机上实施和优化的。
微软打入谷歌“大本营”:在谷歌搜索中投放必应搜索广告!
快科技3月7日消息,近日有网友在社交平台发帖表示,在谷歌搜索的结果页面中,竟然出现了微软必应搜索的广告。该网友表示,当在谷歌搜索besthearingaids(最好的助听器)”时,除了谷歌搜索本身的结果列表之外,还有可能会看到一个来自必应的广告。当点击该广告之后,用户将被定向到必应的搜索结果页面,并且同样显示与besthearingaids(最好的助听器)”相关的搜索结果。0000Meta打造巨型AI模型 为视频推荐引擎注入新活力
互联网巨头Meta正致力于开发一款超大规模的人工智能系统,旨在为其旗下的视频推荐引擎注入新的活力,从而提升用户体验。Facebook的负责人汤姆·埃利森透露,这款巨型人工智能推荐模型是Meta到2026年技术路线图的关键组成部分。该模型不仅能为类似于TikTok的Reels短视频服务提供支持,更能适应传统的长视频内容,为用户提供更加精准的推荐。站长网2024-03-07 16:12:200001AMD 任命前 IBM 高管为首席商务官 希冀在人工智能市场获得更大的立足点
AMD聘请了26年的IBM资深高管PhilGuido担任新的首席商务官,以加强对英特尔和其他竞争对手在商用PC和数据中心市场的竞争。这家总部位于加利福尼亚州圣克拉拉的芯片设计公司周一表示,Guido将担任执行副总裁兼全球销售组织负责人,接替过去八年担任AMD首席销售官的DarrenGrasby的职责。站长网2023-07-12 17:26:020000HuggingFace推出最大的开放合成数据集Cosmopedia 250亿个tokens
划重点:-🌍Cosmopediav0.1是由Mixtral7b生成的最大开放合成数据集,包含超过3000万个样本,总共约250亿个tokens。-💻数据集汇编了来自网页数据集(如RefinedWeb和RedPajama)的信息,涵盖教科书、博客文章、故事和WikiHow文章等各种内容类型。站长网2024-02-21 17:02:590000谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。SIMA无需访问游戏的源代码,也不需要定制的API。只需要输入图像和用户提供的简单自然语言文本指令,SIMA就能像人类玩家一样执行走路、跑步、建造、打开地图等各种游戏中的操作。站长网2024-03-23 00:22:300000