首页站长资讯AI日报：Luma官方亲自下场夸自家“孩子”；日本艺术家用Luma复活妻子看哭网友；苹果AI可能要放大家“鸽子”；北大快手联合推视频生成框架VideoTetris

AI日报：Luma官方亲自下场夸自家“孩子”；日本艺术家用Luma复活妻子看哭网友；苹果AI可能要放大家“鸽子”；北大快手联合推视频生成框架VideoTetris

站长网2024-06-17 19:05:541阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、Luma 官方发视频介绍Dream Machine模型特点

看了Luma官方发布的Dream Machine模型介绍视频，感觉这款AI视频生成工具非常强大。它不仅提供高质量的视频输出，而且能够快速理解用户的提示，生成符合美学风格的视频内容。这对于创意迭代过程非常有帮助，让视频生成变得更加高效。

【AiBase提要:】

🌟 生成的视频质量高，分辨率可达1024像素。

🎨 能理解提示生成符合美学风格的视频。

⚡ 推理速度快，有利于快速迭代创意。

详情链接:https://top.aibase.com/tool/dream-machine

2、新对口型视频项目Hallo发布可对表情，嘴型进行精确控制

新对口型视频项目Hallo发布，通过单张图像和音频输入生成唱歌和说话的视频，实现精确控制人物表情和姿态，提升语音输入与生成动画之间的对齐精度。该技术不仅可用于虚拟角色动画生成，还可应用于真实人物，支持多种运动控制，跨演员应用，以及歌唱动画生成。技术先进，动画逼真，具有广泛的应用潜力。

【AiBase提要：】

⭐️ 根据单张图像和音频输入生成唱歌和说话视频

⭐️ 支持虚拟和真实角色动画生成，项目已开源

⭐️ 多种运动控制，实现精确表情和姿态控制，增强动画的多样性和真实性。

项目地址：https://top.aibase.com/tool/hallo

3、北大快手联合推视频生成框架VideoTetris 复杂视频生成效果超越Pika

本文介绍了北京大学与快手AI团队合作攻克复杂视频生成难题，提出VideoTetris框架，成功超越商用模型Pika和Gen-2。该框架定义了组合视频生成任务，支持复杂指令和长视频生成，保留位置信息和细节特征。团队采用时空组合扩散方法，优化训练数据预处理和引入参考帧注意力机制，生成更具动感和自然的视频。

【AiBase提要:】

⭐ VideoTetris框架成功攻克复杂视频生成难题，超越商用模型Pika和Gen-2。

⭐ 定义了组合视频生成任务，支持复杂指令和长视频生成，保留位置信息和细节特征。

⭐ 采用时空组合扩散方法，优化训练数据预处理和引入参考帧注意力机制，生成更具动感和自然的视频。

详情链接:https://top.aibase.com/tool/videotetris

4、日本AI艺术家用Luma复活妻子网友泪目

这篇文章讲述了65岁的AI艺术家松尾公也用技术复活了他逝去11年的妻子Tori-chan，感动了无数人。通过AI技术，他重新编曲、录制妻子的歌曲，制作动态视频，并提取翻译她的信件，表达对妻子的思念和爱意。这是一个普通人用技术造梦的故事，展现了爱在AI时代的力量和温度。

【AiBase提要:】

🌟 松尾公也用Luma的AI视频Dream Machine复活逝去11年的妻子Tori-chan，感动众人。

🎶 他通过AI技术重新编曲、录制妻子的歌曲，并制作动态视频，展现出对妻子的深深思念。

💖 通过AI工具提取翻译妻子写给他的信，表达出浓浓的爱意和对妻子的永恒思念。

产品入口:https://top.aibase.com/tool/luma-ai

详细文章：https://www.chinaz.com/ainews/9623.shtml

5、苹果AI或计划将延迟推出，开发者要等到夏末才能进行测试

据彭博社报道，苹果的人工智能（AI）计划将是一个漫长而缓慢的过程。苹果公司上周宣布的苹果 Intelligence 计划预计将在夏末晚些时候才能供开发者测试。这意味着它不会成为苹果新操作系统更新的首批测试版，并且仅会在今年秋季推出一个预览版。

【AiBase提要：】

🍏 苹果的人工智能（AI）计划将在夏末晚些时候供开发者测试

📉 苹果计划不会成为新操作系统更新的首批测试版

💬 苹果Intelligence计划将带来改变消费者与设备互动方式，以及购物方式

6、KREA AI推出视频增强功能一键提升视频画质

这篇文章介绍了KREA AI推出的视频增强功能“Enhancer”，可以提升图片和视频画质，并支持更高的分辨率和帧速率。用户可以简单操作，上传需要改善的目标图片/视频，KREA AI将进行在线处理，最终生成高质量视频。

【AiBase提要：】

⭐ Enhancer功能向所有人开放，可以提升图片和视频画质

⭐ 可配合AI视频工具使用，处理完之后，可以在页面直接查看增强效果前后对比

⭐ 可生成最大2.5x像素的视频和高达 120fps 的帧速率。

产品入口:https://top.aibase.com/tool/krea-ai

7、清华与北大合作发布长视频理解基准测试：LVBench

本文介绍了智谱、清华大学和北京大学合作推出的长视频理解基准测试项目LVBench，旨在弥补现有多模态大型语言模型在处理长视频方面的挑战。该项目包含多类别的数小时QA数据，涵盖不同类型的视频内容，旨在推动长视频领域的技术突破和创新。许多研究机构已在LVBench数据集上展开工作，为视频理解和多模态学习领域注入新活力。

【AiBase提要:】

🔍 LVBench项目是长视频理解基准测试项目，包含多类别的数小时QA数据。

💡 LVBench数据集涵盖视频摘要、事件检测、角色识别和场景理解等多种任务。

🚀 LVBench基准的推出将推动相关技术的突破和创新，为长视频领域的发展注入新动力。

详情链接:https://github.com/THUDM/LVBench

8、网格生成模型MeshAnything：将任何3D转换为艺术家创建的网格

近期，由重建和生成创建的3D资产已经达到了手工制作资产的质量水平，凸显了它们在替代领域的潜力。MeshAnything是一种用于生成艺术家创建的3D网格的自动回归模型，通过VQ-VAE和形状条件的仅解码器变压器实现高质量的网格生成。该方法显著提高了存储、渲染和模拟效率，同时保持与以往方法相当的精度。

【AiBase提要:】

⚙️ MeshAnything使用自回归模型生成高质量的艺术家创作的3D网格。

🔍 MeshAnything的网格体提高了存储、渲染和仿真效率，同时保持精度。

🌐 MeshAnything在各个领域都有广泛的应用场景，满足不同用户的创作和需求。

详情链接:https://top.aibase.com/tool/meshanythingMeshAnything

9、哈佛神经科学家和谷歌DeepMind在虚拟老鼠中创建人工大脑

这篇文章介绍了哈佛大学研究人员与谷歌DeepMind团队合作，利用人工智能技术为虚拟老鼠创建人工"大脑"的突破性研究。他们成功建立了生物力学逼真的3D老鼠模型，并利用DeepMind的深度强化学习算法训练了一个人工神经网络大脑，实现了超越真实的模拟效果。这一创新有望为神经科学和人工智能领域带来革命性进展。

【AiBase提要:】

🧠 虚拟老鼠拥有人工"大脑"，能在复杂环境中精确控制运动

🔬 利用DeepMind算法训练的人工神经网络大脑能产生各种复杂运动轨迹和力量

🤖 未来应用前景广阔，可能开创"虚拟神经科学"新领域，为神经系统疾病治疗带来新策略

10、麦当劳宣布结束与 IBM 的 AI 得来速订购合作

麦当劳宣布结束与 IBM 的 AI 得来速订购合作，将在2024年7月26日前移除在100多家餐厅中测试的技术。尽管目前尚不清楚麦当劳为何结束与 IBM 的合作，但该公司表示正在测试语音接单聊天机器人是否能加快服务速度，并对测试结果表示自信。餐饮行业普遍渴望引入 AI 技术来提升效率。

【AiBase提要:】

🍔 麦当劳将结束与 IBM 的 AI 得来速订购合作，将移除在100多家餐厅中测试的技术

🤖 麦当劳正在测试语音接单聊天机器人以加快服务速度

🔮 餐饮行业普遍渴望引入 AI 技术来提升效率

11、研究：人们与ChatGPT对话五分钟，很难区分是否为人类

大型语言模型（LLMs）如 GPT-4模型在聊天平台ChatGPT展现出惊人能力，难以区分其生成的文本是否为人类所写。加州大学圣迭戈分校研究发现，人们与GPT-4对话时很难分辨其是否为人类，展示出机器展现人类智能的程度。

【AiBase提要:】

🔍 GPT-4模型在研究中展现出与人类难以区分的对话能力。

💡 研究结果显示约50%的互动中人们误认为GPT-4是人类。

🎮 设计了名为"人还是不是人"的在线游戏，揭示人们难以可靠判断与人类还是AI系统交谈的区别。

12、多模态模型的画布框架Sketchpad：提升多模态模型数学能力

这篇文章介绍了研究人员引入的“Sketchpad”概念，为多模态LM提供了视觉画板和绘图工具，使其能够进行视觉推理。通过实验结果显示，Sketchpad显著提高了LM在数学任务和复杂的视觉推理任务上的表现，进一步接近人类的思维方式，为人工智能技术的发展开辟了新的可能性。

【AiBase提要:】

🎨 Sketchpad为多模态LM提供视觉画板和绘图工具，使其能进行视觉推理。

🔍 实验结果显示，Sketchpad显著提高了LM在数学任务和复杂的视觉推理任务上的表现。

🚀 Sketchpad使得GPT-4o在所有任务上创下了新的技术水平，包括V*Bench、BLINK空间推理和视觉对应。

详情链接:https://top.aibase.com/tool/visual-sketchpad

AI日报Luma官方亲自下场夸自家孩子 日本艺术家用Luma复活妻子看哭网友苹果AI可能要放大家鸽子 北大快手联合推视频生成框架VideoTetris

0001

评论列表

共(0)条

相关推荐

越要面子，越不赚钱！
各位村民好，我是村长很多人想要赚钱，但是又嫌弃赚钱。为什么呢?因为他总是看着别人赚钱很简单，但自己就是不想吃那个苦，拉不下那个脸。今天村长就和大家说说，为什么很多项目原本可以赚钱，其他人也赚到了钱。但为什么还有那么多人，在那么多项目面前，一直赚不到钱。01只看到别人的结果很多人不管是自己主动要去做某个项目，还是看到别人发文章、发视频、发朋友圈宣传某个项目去做。
站长网站长资讯2023-12-28 16:10:48
0000
站长资讯
IBM在印度甘地讷格尔开设新的客户创新中心聚焦生成式AI
划重点:1.🚀IBM宣布在印度甘地讷格尔开设新的IBM咨询客户创新中心，标志着该公司在印度非大都市和新兴城市的持续扩张。2.💡该中心将聚焦生成式AI、混合云和网络安全等关键技术领域，加速数字转型并促进该地区的经济增长。3.👥甘地讷格尔的扩展将为现有员工提供机会，同时帮助IBM吸纳该地教育生态系统中的潜在人才，包括毕业生。
站长网2023-11-24 16:50:28
0000
站长资讯
I2VEdit：修改单帧即可编辑整个视频搞定虚拟试妆、风格转换
划重点:⭐️利用预训练的图像到视频模型，编辑单帧就能扩散到整个视频⭐️包括粗略运动提取和外观细化两个关键过程⭐️保持外观和运动与原始视频的一致性，减少质量损失的跳跃间隔策略近年来，扩散模型在图像和视频编辑方面的出色生成能力引发了广泛研究。与图像编辑相比，视频编辑在时间维度上面临额外挑战，而图像编辑已经见证了更多种类、高质量方法以及像Photoshop这样更强大的软件的发展。
站长网2024-05-29 19:10:24
0000
站长资讯
2024百家公司上半年业绩排行及分析
近期，各上市公司陆续发布了2024年上半年报。三言汇总了互联网、科技、零售、汽车、旅游、影视等行业为主的近百家上市公司半年报信息，并根据营收和净利润两项维度进行排名。从中也能够看出今年上半年各行各业发展情况。按营收排序:两家电商列前三，前十名仅两家车企分析:
站长网2024-09-04 20:33:37
0000
华为启动鸿蒙原生应用开发者激励计划：12月31日前上架可获10万元
鸿蒙原生应用开发者激励计划开启为了鼓励开发者投入鸿蒙原生应用开发，华为推出了一项专属激励计划。该计划面向有意开发鸿蒙原生应用和元服务的开发者，包括个人开发者和企业开发者。报名时间和要求开发者需在规定时间内提交报名，并于2024年10月10日至2024年12月31日期间完成鸿蒙原生应用或元服务开发，并在HarmonyOSNEXT应用市场正式上架。激励内容
站长网站长资讯2024-10-14 18:33:15
0000