登陆注册
20311

今日AI:Suno《宫保鸡丁》杀入全球AI音乐榜前十;AI太烧钱? Stability AI CEO辞职;Domo AI上线照片转视频功能;Viggle让静态图片跳舞

站长网2024-03-25 19:13:160

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

🤖📱💼AI应用

Domo AI上线新功能 只需一张照片和视频即可让人物动起来

【AiBase提要:】

⭐️ 只需一张照片和一个动态视频就可以让静态的图像跳舞

⭐️ 可获取视频中的动作,自动将照片中的人物融入到视频中

⭐️ 功可以在 Domo AI 的 Discord 频道上体验这项功能。只需使用 /move 命令即可

产品入口:https://top.aibase.com/tool/domoai

Discord下载地址:https://top.aibase.com/tool/discord

视频编辑框架AnyV2V

【AiBase提要:】

⭐️无需训练可以直接集成到现成的图像编辑模型和图像到视频生成模型中

⭐️支持文本提示的各种视频编辑,包括风格转换和面部替换。

⭐️可以根据你的文本提示改变场景中的天气、人物转换等。

项目地址:https://top.aibase.com/tool/anyv2v

文生视频软件Viggle 可通过文字让静态图片跳舞

【AiBase提要:】

⭐ 根据用户文字描述生成视频,可以让角色做各种动作,包括跳舞

⭐ 也支持上传视频,参考视频动作让静态图片动起来

⭐ Viggle不仅限于传统的2D视频制作,它还能够创建3D角色和场景。

产品入口:https://top.aibase.com/tool/viggle

可在discord免费体验:https://discord.com/invite/5kk5SKwTWd

新型文生成视频AI——Gatekeep 可将数学物理问题转换为视频内容

【AiBase提要:】

⭐ Gatekeep是一款新型文本转视频AI,专注于将数学和物理问题转化为视频内容。

⭐ Gatekeep根据用户输入的文本提示,生成包含图表、图示和动画的教学视频。

⭐ Gatekeep在数学学习中特别强调应用,可以帮助学生更直观地理解和掌握知识。

体验地址:https://discord.com/invite/36PTEgY892

Synclabs发布唇型同步模型Sync-1.6.0减少闪烁现象

【AiBase提要:】

⭐️ 新版本唇型同步模型Sync-1.6.0重大升级

⭐️ 优化口型同步准确性和视频质量,减少闪烁

⭐️ 用户可通过浏览器界面或API体验和集成模型服务

体验地址:https://top.aibase.com/tool/sync-labs

视频生成工具StreamingT2V:可根据文字描述生成2分钟长度的视频

【AiBase提要:】

⭐️ 自回归方法逐帧生成视频

⭐️ 长视频生成、高动态效果、时间一致性

⭐️ 文本紧密对齐、高质量图像、模型灵活性

项目页:https://top.aibase.com/tool/streamingt2v

宣称超过XTTS!VoiceCraft:一个支持克隆语音及修改原始音频文本的语音模型

【AiBase提要:】

⭐ 强大的音频克隆能力,通过提供原始音频生成相似新音频

⭐ 支持通过修改原始音频文本编辑音频,提高制作效率

⭐ 演示效果令人印象深刻,显示出巨大潜力

演示页面:https://top.aibase.com/tool/voicecraft

项目地址:https://github.com/jasonppy/VoiceCraft

AI电影生成工具LTX Studio将于3月27日发布

【AiBase提要:】

⭐️ 一键生成电影的工具,根据用户输入的文字生成剧本和视频。

⭐️ 强大功能包括精确指导每个场景、换脸功能和角色生成。

⭐️ 用户可修改、替换角色,提升创造力和自由度。

内测入口:https://top.aibase.com/tool/ltx-studio

📰🤖📢AI新鲜事

百度文心一言或将免费开放 200 万 - 500 万长文本能力

【AiBase提要:】

⭐️ 下个月实施,提供更广泛文本处理能力。

⭐️ 百度文心一言版本升级,长文本能力范围在 200 万- 500 万字。

⭐️ 用户可更轻松处理大篇幅文字,提升处理效率。

《宫保鸡丁》杀入全球AI音乐榜前十!Suno被玩疯了

【AiBase提要:】

⭐ 《宫保鸡丁》用菜谱做歌词,登上全球AI音乐热门榜前十。

⭐ Suno是音乐版ChatGPT,支持生成各种风格、语种歌曲。

⭐ Suno V3版本更高质量,两分钟内生成完整歌曲,支持任意语言。

产品入口:https://top.aibase.com/tool/suno-ai

iOS18或将在系统更新中引入生成式AI功能

【AiBase提要:】

⚡ 苹果预计将在6月的新品发布会上宣布 iOS18的新功能

⚡ 据 Bloomberg 报道,iOS18将引入生成式人工智能功能,并增加存储空间以支持这些功能

⚡ iPhone16的传闻规格包括 RAM 和存储容量升级,以适配新的人工智能功能

Mistral7B v0.2基模型开源,支持32K上下文

【AiBase提要:】

⭐ 提升上下文到32K,取消滑动窗口

⭐ 与微软达成长期合作,微软投资1600万美元

⭐ 发布旗舰级大模型Mistral Large,竞争OpenAI的GPT-4

下载链接:https://models.mistralcdn.com/mistral-7b-v0-2/mistral-7B-v0.2.tar

项目入口:https://top.aibase.com/tool/mistral-7b-instruct-v0-2

AI太烧钱 图像生成头部玩家也玩不起了? Stability AI CEO辞职

【AiBase提要:】

🔍 Stability AI CEO Emad Mostaque辞职,将致力于去中心化人工智能。

📉 公司财务状况压力巨大,CEO被重要投资者要求辞职。

💡 Stability AI面临竞争激烈,采用开源策略导致收入困境。

魔搭社区开源Data-Juicer 、 lite-Sora 类 Sora 模型

【AiBase提要:】

🛠️ 提供一站式工具链,包括数据处理工具、多模态数据集、类 Sora 基础模型、系统 Data-Juicer。

🔧 Data-Juicer含100多种高效算子,可提升视频数据处理效率和质量。

🚀 推出基础类 Sora 模型 lite-Sora,并举办 “ModelScope-Sora 挑战赛” 鼓励开发者参与类 Sora 模型开发。

Data-Juicer页面:https://github.com/modelscope/data-juicer

lite-Sora页面:https://github.com/modelscope/lite-sora

微软开源创新LoRA组合方法,增强文生图复杂细节控制

【AiBase提要:】

🔍 LoRA在文生图领域广泛应用,能准确渲染、融合特定元素,如字符、服装、背景,同时可优化图像操作。

🔍 多重LoRA组合方法由微软和伊利诺伊大学研究人员开发,包括LoRA Switch和LoRA Composite,提高图像生成质量。

🔍 LoRA Switch采用激活顺序切换模式,LoRA Composite则综合各LoRA分数指导图像生成过程,提升多元素图像效果。

项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/

微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本

【AiBase提要:】

⚙️ LLMLingua-2智能压缩长提示,保留关键信息,使提示长度可减少至原长度的20%。

🚀 LLMLingua-2在多数据集上表现显著优于强基线,展现稳健泛化能力。

💻 LLMLingua-2只需两行代码实现,已集成到广泛使用的RAG框架中。

——————

今日Midjourney提示词分享:樱花少女

图源备注:图片由AI生成,图片授权服务商Midjourney

ultra-realistic photo of a beautiful Chinese woman, shot on a Sony a7III, On the streets full of cherry blossoms in Wuhan, Instagram influencer photo, detailed, lifelike --ar3:4--v 6.0

0000
评论列表
共(0)条