AI日报:Luma官方亲自下场夸自家“孩子”;日本艺术家用Luma复活妻子看哭网友;苹果AI可能要放大家“鸽子”;北大快手联合推视频生成框架VideoTetris
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、Luma 官方发视频介绍Dream Machine模型特点
看了Luma官方发布的Dream Machine模型介绍视频,感觉这款AI视频生成工具非常强大。它不仅提供高质量的视频输出,而且能够快速理解用户的提示,生成符合美学风格的视频内容。这对于创意迭代过程非常有帮助,让视频生成变得更加高效。
【AiBase提要:】
🌟 生成的视频质量高,分辨率可达1024像素。
🎨 能理解提示生成符合美学风格的视频。
⚡ 推理速度快,有利于快速迭代创意。
详情链接:https://top.aibase.com/tool/dream-machine
2、新对口型视频项目Hallo发布 可对表情,嘴型进行精确控制
新对口型视频项目Hallo发布,通过单张图像和音频输入生成唱歌和说话的视频,实现精确控制人物表情和姿态,提升语音输入与生成动画之间的对齐精度。该技术不仅可用于虚拟角色动画生成,还可应用于真实人物,支持多种运动控制,跨演员应用,以及歌唱动画生成。技术先进,动画逼真,具有广泛的应用潜力。
【AiBase提要:】
⭐️ 根据单张图像和音频输入生成唱歌和说话视频
⭐️ 支持虚拟和真实角色动画生成,项目已开源
⭐️ 多种运动控制,实现精确表情和姿态控制,增强动画的多样性和真实性。
项目地址:https://top.aibase.com/tool/hallo
3、北大快手联合推视频生成框架VideoTetris 复杂视频生成效果超越Pika
本文介绍了北京大学与快手AI团队合作攻克复杂视频生成难题,提出VideoTetris框架,成功超越商用模型Pika和Gen-2。该框架定义了组合视频生成任务,支持复杂指令和长视频生成,保留位置信息和细节特征。团队采用时空组合扩散方法,优化训练数据预处理和引入参考帧注意力机制,生成更具动感和自然的视频。
【AiBase提要:】
⭐ VideoTetris框架成功攻克复杂视频生成难题,超越商用模型Pika和Gen-2。
⭐ 定义了组合视频生成任务,支持复杂指令和长视频生成,保留位置信息和细节特征。
⭐ 采用时空组合扩散方法,优化训练数据预处理和引入参考帧注意力机制,生成更具动感和自然的视频。
详情链接:https://top.aibase.com/tool/videotetris
4、日本AI艺术家用Luma复活妻子 网友泪目
这篇文章讲述了65岁的AI艺术家松尾公也用技术复活了他逝去11年的妻子Tori-chan,感动了无数人。通过AI技术,他重新编曲、录制妻子的歌曲,制作动态视频,并提取翻译她的信件,表达对妻子的思念和爱意。这是一个普通人用技术造梦的故事,展现了爱在AI时代的力量和温度。
【AiBase提要:】
🌟 松尾公也用Luma的AI视频Dream Machine复活逝去11年的妻子Tori-chan,感动众人。
🎶 他通过AI技术重新编曲、录制妻子的歌曲,并制作动态视频,展现出对妻子的深深思念。
💖 通过AI工具提取翻译妻子写给他的信,表达出浓浓的爱意和对妻子的永恒思念。
产品入口:https://top.aibase.com/tool/luma-ai
详细文章:https://www.chinaz.com/ainews/9623.shtml
5、苹果AI或计划将延迟推出,开发者要等到夏末才能进行测试
据彭博社报道,苹果的人工智能(AI)计划将是一个漫长而缓慢的过程。苹果公司上周宣布的苹果 Intelligence 计划预计将在夏末晚些时候才能供开发者测试。这意味着它不会成为苹果新操作系统更新的首批测试版,并且仅会在今年秋季推出一个预览版。
【AiBase提要:】
🍏 苹果的人工智能(AI)计划将在夏末晚些时候供开发者测试
📉 苹果计划不会成为新操作系统更新的首批测试版
💬 苹果Intelligence计划将带来改变消费者与设备互动方式,以及购物方式
6、KREA AI推出视频增强功能 一键提升视频画质
这篇文章介绍了KREA AI推出的视频增强功能“Enhancer”,可以提升图片和视频画质,并支持更高的分辨率和帧速率。用户可以简单操作,上传需要改善的目标图片/视频,KREA AI将进行在线处理,最终生成高质量视频。
【AiBase提要:】
⭐ Enhancer功能向所有人开放,可以提升图片和视频画质
⭐ 可配合AI视频工具使用,处理完之后,可以在页面直接查看增强效果前后对比
⭐ 可生成最大2.5x像素的视频和高达 120fps 的帧速率。
产品入口:https://top.aibase.com/tool/krea-ai
7、清华与北大合作发布长视频理解基准测试:LVBench
本文介绍了智谱、清华大学和北京大学合作推出的长视频理解基准测试项目LVBench,旨在弥补现有多模态大型语言模型在处理长视频方面的挑战。该项目包含多类别的数小时QA数据,涵盖不同类型的视频内容,旨在推动长视频领域的技术突破和创新。许多研究机构已在LVBench数据集上展开工作,为视频理解和多模态学习领域注入新活力。
【AiBase提要:】
🔍 LVBench项目是长视频理解基准测试项目,包含多类别的数小时QA数据。
💡 LVBench数据集涵盖视频摘要、事件检测、角色识别和场景理解等多种任务。
🚀 LVBench基准的推出将推动相关技术的突破和创新,为长视频领域的发展注入新动力。
详情链接:https://github.com/THUDM/LVBench
8、网格生成模型MeshAnything:将任何3D转换为艺术家创建的网格
近期,由重建和生成创建的3D资产已经达到了手工制作资产的质量水平,凸显了它们在替代领域的潜力。MeshAnything是一种用于生成艺术家创建的3D网格的自动回归模型,通过VQ-VAE和形状条件的仅解码器变压器实现高质量的网格生成。该方法显著提高了存储、渲染和模拟效率,同时保持与以往方法相当的精度。
【AiBase提要:】
⚙️ MeshAnything使用自回归模型生成高质量的艺术家创作的3D网格。
🔍 MeshAnything的网格体提高了存储、渲染和仿真效率,同时保持精度。
🌐 MeshAnything在各个领域都有广泛的应用场景,满足不同用户的创作和需求。
详情链接:https://top.aibase.com/tool/meshanythingMeshAnything
9、哈佛神经科学家和谷歌DeepMind在虚拟老鼠中创建人工大脑
这篇文章介绍了哈佛大学研究人员与谷歌DeepMind团队合作,利用人工智能技术为虚拟老鼠创建人工"大脑"的突破性研究。他们成功建立了生物力学逼真的3D老鼠模型,并利用DeepMind的深度强化学习算法训练了一个人工神经网络大脑,实现了超越真实的模拟效果。这一创新有望为神经科学和人工智能领域带来革命性进展。
【AiBase提要:】
🧠 虚拟老鼠拥有人工"大脑",能在复杂环境中精确控制运动
🔬 利用DeepMind算法训练的人工神经网络大脑能产生各种复杂运动轨迹和力量
🤖 未来应用前景广阔,可能开创"虚拟神经科学"新领域,为神经系统疾病治疗带来新策略
10、麦当劳宣布结束与 IBM 的 AI 得来速订购合作
麦当劳宣布结束与 IBM 的 AI 得来速订购合作,将在2024年7月26日前移除在100多家餐厅中测试的技术。尽管目前尚不清楚麦当劳为何结束与 IBM 的合作,但该公司表示正在测试语音接单聊天机器人是否能加快服务速度,并对测试结果表示自信。餐饮行业普遍渴望引入 AI 技术来提升效率。
【AiBase提要:】
🍔 麦当劳将结束与 IBM 的 AI 得来速订购合作,将移除在100多家餐厅中测试的技术
🤖 麦当劳正在测试语音接单聊天机器人以加快服务速度
🔮 餐饮行业普遍渴望引入 AI 技术来提升效率
11、研究:人们与ChatGPT对话五分钟,很难区分是否为人类
大型语言模型(LLMs)如 GPT-4模型在聊天平台ChatGPT展现出惊人能力,难以区分其生成的文本是否为人类所写。加州大学圣迭戈分校研究发现,人们与GPT-4对话时很难分辨其是否为人类,展示出机器展现人类智能的程度。
【AiBase提要:】
🔍 GPT-4模型在研究中展现出与人类难以区分的对话能力。
💡 研究结果显示约50%的互动中人们误认为GPT-4是人类。
🎮 设计了名为"人还是不是人"的在线游戏,揭示人们难以可靠判断与人类还是AI系统交谈的区别。
12、多模态模型的画布框架Sketchpad:提升多模态模型数学能力
这篇文章介绍了研究人员引入的“Sketchpad”概念,为多模态LM提供了视觉画板和绘图工具,使其能够进行视觉推理。通过实验结果显示,Sketchpad显著提高了LM在数学任务和复杂的视觉推理任务上的表现,进一步接近人类的思维方式,为人工智能技术的发展开辟了新的可能性。
【AiBase提要:】
🎨 Sketchpad为多模态LM提供视觉画板和绘图工具,使其能进行视觉推理。
🔍 实验结果显示,Sketchpad显著提高了LM在数学任务和复杂的视觉推理任务上的表现。
🚀 Sketchpad使得GPT-4o在所有任务上创下了新的技术水平,包括V*Bench、BLINK空间推理和视觉对应。
详情链接:https://top.aibase.com/tool/visual-sketchpad
新一代安卓机皇!小米15 Ultra现身:预计2025年2月发布
快科技7月9日消息,小米15和小米15Pro目前已经基本准备完善,最快会在10月份发布上市。小米15Ultra则会稍晚一些,但是目前已经在IMEI数据库现身,国行代号为25010PN30C,将会国内、印度、全球市场上市。从机型代码来看,该机预计会在预计2025年2月发布,与小米14Ultra时间大致相同。只是目前时间过早,还没有关于小米15Ultra的任何具体信息曝光。站长网2024-07-09 15:51:200000品牌直播2023:内卷与突围
回顾2023年,红利消退、降本增效成为越来越多品牌的共识,相较几年前找大主播带货的“轻松”,品牌们不得不走出舒适区,或大搞内容,或开启撒钱模式,或探索新平台新玩法,期待能真正积累起属于自己的企业数字化内容资产。多番尝试下,有人为活力28的“三个小老头”疯狂下单,有人为椰树的荷尔蒙直播频频点赞,有人因为79元眉笔事件开始重新思考品牌的营销动作……站长网2024-01-04 14:23:540002联合国教科文组织:由OpenAI和Meta支持的AI工具存在性别歧视内容
**划重点:**1.📌联合国教科文组织研究发现,由OpenAI和Meta算法推动的全球最广泛使用的AI工具存在性别歧视。2.📌专家评估了2种算法以及OpenAI的GPT-2和GPT-3.5,后者是广受欢迎的ChatGPT聊天机器人的驱动程序。3.📌研究指出,大型语言模型(LLMs)显示了对女性的明显偏见,产生将女性与“家庭”、“家庭”或“孩子”等词语联系在一起的文本。站长网2024-03-08 13:36:360000张大仙入驻抖音,腾讯字节不再“掰手腕”
11月27日,《王者荣耀》著名主播张大仙官宣入驻抖音直播,在冯提莫、旭旭宝宝、柯洁之后,又一头部主播官宣抖音,抖音的游戏直播无疑呈现出扩张之势。与此同时,字节在大刀阔斧裁剪自研游戏业务。根据雪豹财经社报道,字节正寻求以不低于50亿美元的价格出售旗下的沐瞳科技,留给另一子公司朝夕光年的时间也并不多。站长网2023-12-05 10:37:220000SensorTower:王者荣耀4月吸金2.13亿美元 蝉联冠军
今日,手游情报平台SensorTower公布了2023年4月全球热门移动游戏收入TOP10。数据显示,2023年4月腾讯《王者荣耀》在全球AppStore和GooglePlay吸金2.13亿美元,蝉联全球手游畅销榜冠军。站长网2023-05-17 10:24:260001