AI日报:Luma AI文生视频模型炸裂程度堪比Sora;Stable diffusion 3 正式开源;Suno正式发布音频输入功能;阿里发布“融图”工具MimicBrush
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、Luma AI推重磅级文生视频模型Dream Machine 炸裂程度堪比Sora
Luma AI最新发布的文生视频模型Dream Machine免费开放使用,可生成高质量视频,具有与OpenAI的Sora相媲美的质量。模型支持物理模拟,确保视频真实性和连贯性。用户体验可能受到生成效率影响,但可通过提供的案例来体验视频效果。国内竞品如快手的“可灵”也在竞争中崭露头角,预示着文生视频领域的竞争将更加激烈。
【AiBase提要:】
👉 Dream Machine支持文本和图片输入生成视频
👉支持物理模拟,如重力下落、碰撞和光影变化
👉 Dream Machine提供免费使用,生成的视频在质量、动作一致性、色彩、光影、饱和度和运镜等方面可与OpenAI的Sora相媲美。
更多视频点此查看:https://mp.weixin.qq.com/s/DreeYriR9MdvdvvRQ7ZkAw
免费体验地址:https://top.aibase.com/tool/dream-machine
2、Stable diffusion 3 正式开源:超强文生图模型SD3-M登场
SD3-M是一款强大的文生图模型,拥有20亿参数,推理速度高效,生成效果优秀。Stability AI开源了SD3-M权重,为用户提供免费试用机会。模型使用MMDiT架构,在图片质量、排版、文本提示理解等方面取得显著提升。用户可通过在线demo体验SD3-M生成效果,但目前仅用于学术研究,商业需求需联系Stability AI。开源SD3-M为用户探索文生图模型应用潜力带来机遇。
【AiBase提要:】
⚙️ SD3-M拥有20亿参数,生成速度快,硬件需求低,性能最高可提升50%。
🌟 SD3-M使用10亿张图片进行预训练,3000万张图片进行微调,生成效果惊艳非凡。
🔓 SD3-M开源免费试用,但目前仅用于学术研究,商业需求需联系Stability AI。
详情链接:https://top.aibase.com/tool/stable-diffusion-3-mediumSD3-M
3、Suno正式发布音频输入功能 可以用任何声音创作歌曲
Suno最近推出了令人兴奋的新功能,允许用户从任何声音中创作歌曲。这项创新的功能为专业版和高级版用户开放,为音乐创作带来新的可能性,展示了AI技术在艺术创作领域的应用潜力。用户可以随时随地捕捉灵感,将日常生活中的声音转化为美妙的音乐作品。
【AiBase提要:】
🎶 音频输入功能开放给专业版和高级版用户,允许转化各种声音为音乐作品。
🔒 用户权限受限,只有专业版和高级版用户可以使用该功能。
📻 Suno还发布了电台功能,提供个性化播放列表,让用户享受无尽的音乐流。
详情链接:https://top.aibase.com/tool/suno-ai
4、MimicBrush:上传图片参考,实现原图局部风格重绘
MimicBrush是香港大学研究团队提出的一种零参考图像编辑技术,通过自监督学习实现图像编辑,无需用户准确描述编辑效果。其创新之处在于自动理解参考图片,提高编辑准确度和效率。
【AiBase提要:】
🎨 零参考图像编辑,简化用户操作,无需描述编辑效果。
🔍 MimicBrush模型通过自监督学习捕捉图像语义对应关系,提高编辑效果准确度。
🚀 实验结果显示MimicBrush技术在各测试案例下表现优越,具有更高的编辑效率。
详情链接:https://top.aibase.com/tool/mimicbrush
5、抖音博主用AI绘画将各地美食变成怪兽形象 6条视频播放量1700万
这篇文章介绍了抖音博主“一条咸鱼微”运用AI绘画技术将各地传统美食转化为怪兽形象的创意作品,引发了广泛关注。通过生动的怪兽形象,博主展示了中国不同地区的独特美食文化,同时巧妙运用网络梗增添幽默元素,让人对地域文化有了更深的认识。作品创意十足,让人印象深刻。
【AiBase提要:】
🎨 创意转化:各地美食巧妙变身为怪兽形象,生动有趣。
😄 幽默元素:运用网络梗增添幽默,让人忍俊不禁。
🌏 地域文化:展示地域美食特色,让人感受到中国各地的文化魅力和差异。
6、人类胜AI!一张真实照片在人工智能图像大赛中获得第三名
这篇文章讲述了一张伪装成人工智能生成的照片在艺术摄影比赛中获得第三名的事件,引发了人们对人工智能与人类艺术之间界限的思考。摄影师Miles Astray的作品《FLAMINGONE》展示了火烈鸟的照片,虽然看起来像是人工智能创作,但实际上是真实作品。文章强调了人工智能在艺术创作中的局限性,以及人类创作的独特价值。
【AiBase提要:】
🤖 人工智能与人类艺术界限:一张真实照片被误认为是人工智能生成作品。
📷 摄影师Miles Astray的作品《FLAMINGONE》引发广泛关注。
🎨 人工智能艺术的局限性:缺乏人类艺术作品中的情感和意图。
7、900万人围观哈利波特唱Rap 网友:欢迎收看“AI有嘻哈”
这篇文章介绍了一段哈利波特变身嘻哈歌手的视频在网络上引起轰动的情况。视频展现了哈利波特和海格以全新形象出现,表演充满活力,吸引了大量观众的关注。原作者通过AI技术与艺术、娱乐结合,创作了这段充满创意和趣味的视频,展示了新的可能性。
【AiBase提要:】
🔥 视频展现哈利波特和海格以嘻哈歌手形象出现,引起大量关注。
💡 原作者通过AI技术变换音色,创作了充满活力的Rap表演。
😂 视频混搭风格让网友捧腹大笑,展示了跨界创作和艺术形式的潜力。
8、Uizard发布Autodesigner 2.0 AI设计引擎
Uizard公司发布了全新的Autodesigner 2.0 AI设计引擎,结合了专有模型、Anthropic AI和OpenAI的技术,以及Stability AI的图像生成技术,简化了UI设计流程,提高设计效率和创新性。
【AiBase提要:】
🌟 文本提示生成设计: 用户通过简单文本提示生成完整UI设计,适应不同应用场景。
💬 对话模式交互: 引入对话模式,用户可以与设计助手互动生成设计、添加元素、修改组件。
🔄 实时设计与迭代: 用户可实时查看编辑AI生成设计,快速迭代满足设计需求。
详情链接:https://top.aibase.com/tool/uizard
9、吴恩达开源 AI 智能体机器翻译项目Translation Agent
吴恩达最新开源的 AI 智能体机器翻译项目Translation Agent,利用反射式代理工作流程和 LLM 技术提供高度定制化的翻译服务,为用户提供灵活设定语气、地区特色和专业术语表的翻译体验。该项目的可定制性和灵活性将推动 AI 智能体在机器翻译领域的广泛应用。
【AiBase提要:】
🤖 提供反射式代理工作流程,利用 LLM 技术进行翻译,反思并提出改进建议,提高翻译质量。
🔧 可定制性强,允许用户修改输出风格、处理特殊术语和指定特定区域或方言的语言使用。
🌍 适用于不同语言对的翻译,通过调整提示和选择不同的 LLM,实现更优质的翻译效果。
10、三星计划加速交付人工智能芯片
三星电子计划通过整合存储芯片、晶圆厂和芯片封装服务加速人工智能芯片生产,预计到2028年人工智能芯片需求将成为主要增长推动力。公司推出2纳米芯片制造工艺和计划量产第二代3纳米芯片,展现技术领先优势。
【AiBase提要:】
🚀 三星整合存储芯片、晶圆厂和芯片封装服务,缩短人工智能芯片生产时间约20%。
💡 预计到2028年,全球芯片行业收入将增长至7780亿美元,人工智能芯片需求将成为主要推动力。
🔬 三星推出2纳米芯片制造工艺和计划量产第二代3纳米芯片,展现技术领先优势。
国内真无对手!比亚迪7月狂卖262161辆:能打十个新势力
快科技8月1日消息,比亚迪公布了其7月份销量,7月新能源汽车共交付262161辆,上年同期销量162530辆,同比增加61.3%;而比亚迪今年销量已累计达1517798辆,同比增长87.63%。据悉,比亚迪今年加大的海外业务布局,随着销售店的陆续建成,其海外销量也在逐步增加,比亚迪7月海外销售新能源车已达18169辆。站长网2023-08-01 19:53:490000调查显示:1/3的翻译者和1/4的插画师已经因AI失去了工作
英国作家协会对12,500名成员进行了一项关于生成性人工智能(AI)的影响调查,收集了近800份反馈,揭示了AI技术对作家、翻译者、插画师等职业的深远影响。图源备注:图片由AI生成,图片授权服务商Midjourney调查的主要发现包括:使用生成性AI的创作者:约五分之一的受访者(22%)在工作中使用过生成性AI。站长网2024-04-28 15:51:310000你在直播间买的书可能是假的,已有卖家被抓,涉案金额三千多万
电商平台上的正版畅销书竟是盗版卖书直播间里“挂羊头卖狗肉”的情况还真不少。随着短视频与直播平台的崛起,这些新兴渠道本应是传播知识、促进阅读的新舞台,却不料成为了盗版书商泛滥的温床。这些盗版书商打着正版之名低价卖书,让众多消费者防不胜防。近日,四川广安前锋区警方就破获了一起涉案金额高达3000多万元的侵犯著作权案。站长网2024-08-16 17:57:230000阿里AI新品“通义听悟”正式上线 智能总结、实时语音转文字等
在阿里云峰会·粤港澳大湾区分会场,阿里云公布了通义大模型的进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。据了解,通义听悟是一款工作学习AI助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。站长网2023-06-02 00:11:230002卢伟冰返场直播定档11月9日:回应为何不发小米15销量战报
小米11月直播:卢伟冰回应销售谜团小米今天宣布,卢伟冰将在11月9日晚8点进行直播。在此次直播中,卢伟冰将揭秘小米15销量战报背后的原因。此前,小米14系列销量一直是谜团,官方仅公布了首销5分钟内销量为小米13系列6倍的数据。雷军上周五的直播中透露,他不担心小米15的销售,其销售情况是过去几代产品中最好的。0000