AI视野:ElevenLabs将为Sora上线AI音效功能;文生图模型Stable Cascade上线;苹果推出AI动画设计工具Keyframer;AI生成的西游记短片震惊网友
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
ElevenLabs宣布将上线AI音效功能 可给Sora生成的视频配音

【AiBase提要:】
⭐️Sora生成的视频十分惊艳但缺少配音
⭐️ElevenLabs将推出AI音效功能,用户输入文字描述即可生成配音
⭐️首批试用申请地址:https://form.typeform.com/to/gg0xzZW4?typeform-source=t.co
Stability AI推出文生图模型Stable Cascade 仅限于非商用

【AiBase提要:】
⭐️ Stable Cascade基于Würstchen架构
⭐️ 非商用许可证,仅限于非商业用途
⭐️ 压缩潜在空间,训练推理效率更高
项目地址:https://top.aibase.com/tool/stable-cascade
谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全
【AiBase提要:】
⚔️ 提升安全: 在Google内部应用于Gmail、Drive和安全浏览,强化文件安全检查和内容策略扫描。
🔄 开源易用: 支持多种文件类型、高效性能,即将与VirusTotal集成,GitHub提供代码和模型。
🚀 高效识别: 使用自定义深度学习模型,毫秒级内准确识别100 文件类型。
项目入口:https://top.aibase.com/tool/magika
图像分割模型Mask2Former:同时支持语义、实例和全景分割

【AiBase提要:】
⭐️ 优化后,在图像分割任务中取得卓越性能,包括多尺度高分辨率特征。
📈 性能分析表明在多个任务上表现优越,但在资源受限设备上FPS可能受限。
🔬 架构包括特征提取网络、像素解码器和Transformer解码器,局部化注意力提升性能。
苹果推出AI动画设计工具Keyframer 可将静态图片转为动画

【AiBase提要:】
⭐️ 巨大潜力,但面临挑战
⭐️ Keyframer结合自然语言提示和LLMs代码生成
⭐️ 提供可能性,支持设计迭代,多用户群体参与动画创作
论文地址:https://arxiv.org/pdf/2402.06071.pdf
📰🤖📢AI新鲜事
OPPO AI战略发布会官宣将于2月20日举行
【AiBase提要:】
⭐2024年将被铭记为AI手机的元年,AI对手机行业的影响将革命性变革。
⭐OPPO宣布正式进入AI手机时代,致力于提升用户体验。
⭐OPPO建立专门的AI中心,推动AI手机时代的发展。
张楠宣布辞任抖音集团CEO 重心转向剪映AI辅助创作
【AiBase提要:】
⭐️ 张楠将全力投入剪映相关业务
⭐️ 亲自带队寻求AI辅助创作领域突破
⭐️ 字节跳动各部门加大对AI产品研发投入
AI生成的西游记短片震惊网友

【AiBase提要:】
🎥 利用AI技术创作《西游记》动画短片
🌟 视觉效果精湛引发网友热议
⏰ 仅用一周时间完成创作
孙正义宣布1000亿美元AI芯片项目计划后,软银股价飙升
【AiBase提要:】
⭐ 孙正义考虑创立1000亿美元人工智能芯片公司
💰 软银计划提供300亿美元,其余700亿可能来自中东
🌐 项目成功将占全球半导体市场五分之一
文生视频大模型Sora引发热议:背后团队现身谢赛宁否认涉及
【AiBase提要:】
🔍 谢赛宁否认与Sora有关联
🔍 重要性强调人才、数据和算力
🔍 警示信息传播需注意安全和监管
优酷首部AI辅助生成特效画面的电视剧《大唐狄公案》开播
【AiBase提要:】
⭐️ 该剧利用人工智能技术生成长安城场景
⭐️ 人流、街景、建筑等场景完全由人工智能生成
⭐️ 制作效率提高70%,制作时间可进一步缩短
马斯克称特斯拉公司视频生成技术超越OpenAI Sora
【AiBase提要:】
⭐ 特斯拉视频技术领先全球,超越OpenAI Sora
⭐ 马斯克分享特斯拉一年前的自动驾驶视频
⭐ 特斯拉考虑制作视频游戏,需先发布无监督全自动驾驶系统
深扒Altman巨型AI帝国:从核聚变工厂到永生技术中心,规模惊人!
【新智元导读】SamAltman构建的未来AI帝国正式曝光,规模惊人!可控核聚变、7万亿芯片产业、光量子计算,甚至是延长人类寿命的研究,个个都是「登月级」。同时,OpenAI董事会风波又有了新的爆料,ChatGPT之母竟扮演了重要角色。从可控核聚变到AGI,再到重塑整个芯片行业,Altman未来的AI版图已经不仅仅是成立科技公司挣更多的钱了。站长网2024-03-09 18:00:1900015999元起!vivo发布上下折叠屏手机X Flip:魔幻3寸外屏、妹纸最爱
快科技4月20日消息,今晚vivo在线上举行了新品发布会,其中一款就是XFlip,从发布后的反馈情况看,还是很受妹子们的喜欢。站长网2023-04-20 22:03:580000AI大模型折叠:数据标注“民工”月入不过5000,单价从5毛降到4分
郑雯至今觉得记得几个月的下午,那天,她一个小时就赚了2毛钱。她毕业于湖南的一所专科学校,是一名大模型数据标注师,每天的工作并不复杂——给自己领取的原始数据(如图像、视频、文本等)添加标签。站长网2023-10-09 14:32:470000英伟达AI游戏引擎炸场CES!NPC与玩家实时交互,对话动作流畅似真人
《赛博朋克2077》里的NPC,已经会和玩家对话了?还是根据玩家说的话实时响应,不用背剧本的那种?在CES2024的活动上,英伟达展示了利用AvatarCloudEngine(ACE)技术打造的最新成果。在ACE的加持之下,游戏中的人物纷纷“活”了起来,与其他角色甚至真人玩家一起对话交流,并根据对话内容做出动作。站长网2024-01-10 14:02:170000北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
AI能理解搞笑视频笑点在哪里了。AI回答:这个视频之所以搞笑,在于一个小宝宝正坐在床上努力读书,但他显然还不会真正读书。他只是不停地指着书页上的各处,而摄影者则在背后笑他。小宝宝的这种尝试很有趣,因为他在尝试阅读一本对他而言过大的书,也看不懂里面的文字。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。站长网2023-11-21 09:15:550000