首页站长资讯今日AI：华为发布4K图像模型PixArt-Σ；这个ComfyUI插件可以还原梦境；Pika把音效视频一锅端了；公众号可以一键集成多种AI功能了

19768

今日AI：华为发布4K图像模型PixArt-Σ；这个ComfyUI插件可以还原梦境；Pika把音效视频一锅端了；公众号可以一键集成多种AI功能了

站长网2024-03-11 16:02:201阅

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

华为发布图像生成模型PixArt-Σ可直出4K图像

【AiBase提要:】

⭐采用DiT架构，可直接生成4K图像

⭐借助PixArt-alpha基础预训练，实现弱到强训练

⭐结合高质量训练数据和高效Token压缩，生成高分辨率图像

项目地址:https://top.aibase.com/tool/pixart

ComfyUI-Dream-Interpreter:还原梦境的ComfyUI工作流输入梦境描述生成全景图

【AiBase提要:】

⚙️可通过GitHub克隆项目进行使用

🌌项目结合了梦境解析器和ComfyUI，提供梦境输入、解析和生成功能

🖼️生成全景图像，让用户交互式探索梦境，创新结合梦境解析与交互画面。

Pika发布SoundEffects功能生成的视频可以自动配音效了

【AiBase提要:】

⭐用户可以通过描述prompt或让AI自动生成音效为视频增添氛围

⭐SoundEffects操作简单，用户只需一个prompt或简单描述就能生成音效

⭐功能目前仅对特定用户开放测试，未来将向所有用户推出

项目地址:https://github.com/pwh-pwh/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中

【AiBase提要:】

⭐️集成多种AI服务（如GPT、星火、通义千问、Gemini等），允许微信公众号通过文本消息与用户进行智能对话。

⭐️支持连续问答，实现了超时回复和记忆对话内容（最长30分钟）

⭐️具备图床功能和被关注时的自定义回复功能

项目地址:https://top.aibase.com/tool/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

OptimizerAI:可为AI视频自动配音还将支持立体声

【AiBase提要:】

⭐️通过文字提示创造适用于各种场景的声音和音效。

⭐️支持声音效果生成、变声、风格标签指定，保持生成一致性。

⭐️即将支持文本到声音效果转换、立体声、高质量音频生成。

官网地址:https://www.optimizerai.xyz/

在线体验地址:https://discord.com/invite/bgfnVaaU2n

EasyDiffusionOnline:一款免费的AI绘画工具

【AiBase提要:】

⭐用户可以免费使用图像生成器和提示生成器。

⭐EasyDiffusionOnline提供多种创作类型，适合不同用户。

⭐平台功能强大，用户可以实现创意想法并分享作品。

体验地址:https://top.aibase.com/tool/easydiffusion-online

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量

【AiBase提要:】

⭐新技术StableDrag基于Diffusion模型，拖动锚点编辑图片。

⭐提供两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。

⭐目前只上线了论文，试玩页面和代码暂未放出

项目地址:https://top.aibase.com/tool/stabledrag

AI实时绘图工具ImgPilot一键将草图转为艺术作品

【AiBase提要:】

⭐支持实时绘图，随手涂几笔就能变成好看的画

⭐ImgPilot项目基于LeptonAI技术开发，结合多种技术提高效果

⭐提供前后端代码，用户可自由定制部署

项目地址:https://github.com/leptonai/imgpilot

试玩页面:https://top.aibase.com/tool/imgpilot

MIT博士生用VisionPro实时训练机器狗开源项目TrackingSteamer火了

【AiBase提要:】

⭐MIT博士生开源项目VisionPro实时训练

⭐应用程序利用VisionPro追踪人类动作实时传输到其他机器人设备

⭐人类可以为机器人提供精准训练数据，促进人机交互技术的发展

项目地址:https://github.com/Improbable-AI/VisionProTeleop

📰🤖📢AI新鲜事

每年电费2亿?ChatGPT每天竟然要消耗1.7万个家庭的用电量

【AiBase提要:】

🔋OpenAI旗下ChatGPT每日消耗超过50万千瓦时电力，约为1.7万个家庭的用电量。

🔌AI数据中心用电量未来或与小国相当，谷歌等公司搜索请求也消耗大量能耗。

💡AI技术发展需节约能源，监管机构监督企业用电行为，促进可持续发展。

Nvidia因使用侵权作品训练NeMoAI平台被作者起诉

【AiBase提要:】

📚三位作者控告Nvidia未经许可使用其版权图书训练NeMoAI平台。

🚫作者指称Nvidia在NeMo训练后撤下他们的作品。

💡该案或成AI领域版权和数据使用重要先例，影响行业规范和公司行为。

新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等

【AiBase提要:】

🔄采用可扩展的“从模拟到实际”处理，构建大规模的重定目标运动数据集。

🔄通过训练鲁棒的全身机器人模仿者，成功实现了在真实场景中的动态全身运动遥操作。

🔄通过特权模仿者选择可行动作，确保人形机器人对人类运动高度还原。

项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

微软AI研究推数学LLMOrca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

【AiBase提要:】

⭐Orca-Math通过合成数据集和迭代学习重新定义数学问题教学方法。

⭐Orca-Math在GSM8K基准上取得显著成就，展示SLM在教育中的潜力。

⭐Orca-Math利用迭代学习机制取得成功，在解决数学问题方面取得显著进步。

论文地址:https://arxiv.org/abs/2402.14830

谷歌发布Gemini1.5Pro模型技术报告长文记忆能力惊人

【AiBase提要:】

⭐Gemini1.5Pro模型架构、训练数据与基础设施介绍

⭐长篇信息检索任务中完美的记忆回溯能力

⭐长篇信息处理任务准确率达到99%以上

论文地址:https://arxiv.org/pdf/2403.05530.pdf

全球AI人才报告曝光:清华第三，北大第六!

【AiBase提要:】

⭐中国培养出的AI人才占全球近1/2

⭐美国码农面试需12场，薪资压低，面试题难

⭐Meta压低薪资，裁员潮下AI人才需求狂涨42%

谷歌称GeminiNanoAI大模型暂不支持Pixel8手机

【AiBase提要:】

🌟GeminiNano是谷歌旗下Gemini大模型的移动版本。

🌟由于硬件限制，GeminiNano目前无法在Pixel8手机上运行。

🌟但谷歌表示未来将在其他高端设备上推出GeminiNano。

网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞

【AiBase提要:】

⭐WhiteRabbitNeo发布了新模型，利用Transformers和PyTorch技术，专注于网络安全领域。

⭐这款模型可识别各种安全威胁和漏洞，如开放端口、未加密服务、API漏洞等。

⭐WhiteRabbitNeo模型还可应用于编程和代码生成领域，帮助解决编程问题。

————————————

今日Midjourney提示词分享:梨花树下的女孩

垫图 masterpiece，bestquality，AbeautifulChinesegirlwearingabeigesuitjacket，blackhair，shorthair，roundface，detailedfacialdetails，naturallight，glasses，solo，photobackground，outdoors，shirt，realistic，lookingatviewer，tree，atreefullofpearblossoms，teeth，crossedarms，whiteshirt，longhair，smile，roundeyewear，longsleeves，day，jacket，upperbody，highdefinitionphotography，CapturedbyCanoncamera--ar3:4--s750--styleraw--v6.0

今日AI华为发布4K图像模型PixArt这个ComfyUI插件可以还原梦境Pika把音效视频一锅端了公众号可以一键集成多种AI功能了

0001

评论列表

共(0)条

相关推荐

站长资讯
问界新M7年度累计交付破13万拿下2024年中国新势力销冠
快科技8月13日消息，鸿蒙智行官方今日发文宣布：问界新M7汽车年度累计交付突破13万台，获2024年中国新势力车型销量冠军。据悉，去年9月底，问界新M7上市后不仅补足短板，还大幅降低了售价，起售仅24.98万，上市第一个月大定就超过6万台、50天超8万台、64天超9万台、4个月时间超13万，最终大定量超18万。
站长网2024-08-15 16:41:17
0000
站长资讯
前Reddit CEO称科技巨头AI竞赛过度导致产品质量下降
划重点:⭐️科技巨头因为过度追逐AI竞赛，导致产品质量下降⭐️AI产品质量下降的原因在于巨头争相整合LLM-poweredAI，导致出现错误答案⭐️前Google员工和前RedditCEO都批评科技巨头在AI竞赛中的努力
站长网2024-05-24 10:42:46
0000
站长资讯
爆火的生成式AI，能让智能音箱起死回生吗？
智能音箱这类如今几乎已经被大量消费者遗忘的产品，在此前经历了2017年、2018年的“疯狂”之后，早已不再是大多数消费者关注的对象。就在大家以为智能音箱会昙花一现时，ChatGPT的横空出世似乎让智能音箱有了焕发第二春的可能，也给了这个在走下坡路的行业一个新的机遇。那么，智能音箱与如今爆红的生成式AI能擦出火花吗?
站长网2023-06-12 03:42:43
0000
站长资讯
创纪录！小米通讯公开发行10亿元债券获5.4倍超额认购
快科技7月24日消息，小米集团副总裁，首席财务官林世伟宣布了小米创造的一个新记录。昨日，小米通讯成功公开发行科技创新高成长产业公司债券，发行规模10亿元，期限3年，主体评级AAA。该债券全场获得5.4倍的超额认购，最终发行的票面利率2.00%，创智能制造行业企业同期限公司债的新低记录。评级AAA反映公司偿还债务的能力很强，基本不受不利经济环境的影响，违约风险极低。
站长网2024-07-25 02:36:14
0001
站长资讯
红豆集团与科大讯飞将共同打造服装大模型
红豆集团与科大讯飞宣布战略合作，共同探索人工智能技术在纺织服装行业的应用。合作旨在通过大模型技术赋能纺织服装行业，提升研发效率和消费体验，共同打造通用人工智能应用领域的行业标杆。据悉，科大讯飞的讯飞星火认知大模型具有跨领域的知识和语言理解能力，可优化服装行业的生产、设计、零售和售后服务环节。双方表示合作具有重要意义，将为纺织服装行业带来创新和突破，为用户创造更好的产品和服务。
站长网2023-08-16 09:09:54
0000