AI日报:美图发布AI视频神器MOKI;OpenAI靠ChatGPT半年赚34亿美元;斯坦福开发对口型视频模型PROTEUS
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、美图发布王炸产品MOKI 可一键生成AI视频短片
美图公司发布了名为MOKI的AI视频制作工具,实现了一键生成AI视频短片的功能,展示了其在AI领域的深入布局和创新能力。尽管实际效果有待用户评价,但市场已经对其潜力表示关注。
【AiBase提要:】
⭐MOKI是美图公司推出的AI短片创作工具,专注于网文短剧、故事绘本、动画短片和MV四种视频形式的创作。
⭐MOKI通过内置的视频生成模型和工作流,用户输入文本提示即可同时完成脚本、角色、视频和音效配音等内容的生成
⭐高度可控,能够实现一键生成AI视频短片,该产品将于 7 月 31 日开放体验
官网地址:https://top.aibase.com/tool/moki
2、斯坦福大学开发!对口型视频模型PROTEUS可让图片开口唱歌
斯坦福大学与Apparate Labs联合推出的AI模型PROTEUS实现了通过单张照片生成逼真虚拟人物,并实时唱歌和说话的功能。该模型具有实时生成逼真人物、高帧率视频流、多模态交互等特点,可应用于个性化虚拟助理、虚拟宠物、客户服务等多个领域。PROTEUS的愿景是提供可通过语音控制的视觉化体现,为用户带来自然的虚拟人物交互体验。
【AiBase提要:】
👩💻 实时生成逼真人物,展现复杂面部表情和身体动作。
🎥 支持高帧率视频流,实现流畅的互动体验。
💬 多模态交互,适用于语音、文本和图像等多种数据形式。
详情链接:https://apparate.ai/stream.html
3、FontStudio:轻松制作各种纹理炫酷字体效果
FontStudio是一种新方法,可以帮助制作漂亮的字体效果,让作品更有趣和独特。使用扩散模型技术在不规则形状的画布上生成字体效果,引入分割掩模技术保持形状一致性。用户偏好研究显示,FontStudio受到很多人喜爱,甚至比市面上的商业产品Adobe Firefly有优势,具有美学吸引力。
【AiBase提要:】
🎨 制作漂亮字体效果
🔍 使用扩散模型技术生成不规则形状字体效果
🔗 引入分割掩模技术保持形状一致性
产品入口:https://top.aibase.com/tool/fontstudio
4、OpenAI年化营收跃升至34亿美元 订阅版ChatGPT成主要推动力
OpenAI近期年化营收达到34亿美元,增长迅速。主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。
【AiBase提要:】
📈 OpenAI年化营收达到34亿美元,增长迅速。
💡 主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。
🤝 最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。
5、VideoLLaMA 2: 上传视频可根据指令实时识别解读视频内容
随着人工智能技术的发展,VideoLLaMA2项目应运而生,旨在推进视频大语言模型时空建模和音频理解能力。该项目能够帮助用户更好地理解视频内容,识别速度快且精准。
【AiBase提要:】
🚢 高级多模态语言模型,提升视频内容理解能力。
⏰ 精确的时空建模,识别视频中的动作和事件顺序。
🔊 出色的音频理解能力,分析视频中的声音内容。
详情链接:https://top.aibase.com/tool/videollama-2
6、机器人会自己开车了!东京大学开发肌骨类人机器人Musashi
Musashi是一款肌骨类人机器人,具备自主驾驶能力,展示了自动驾驶领域的潜力。尽管在转弯速度和加速控制方面存在限制,但其硬件设计和软件系统结合的方式为未来智能化驾驶体验提供了新思路。研究成果已在论文中发表,为自动驾驶技术发展打下重要基础。
【AiBase提要:】
🤖 Musashi是肌骨类人机器人,具备视觉感知和驾驶操作能力。
🚗 Musashi能够驾驶小型电动车,遵守交通规则并识别交通信号灯、行人和其他车辆。
🔬 Musashi的工作原理包括硬件设计模仿人类肌肉骨骼结构和软件系统结合多种基于学习的模块。
详情链接:https://arxiv.org/pdf/2406.05573
7、指环王 赛博朋克2077!网友用AI制作电影预告片播放破百万
我对这篇文章感到非常兴奋和惊叹。一位网友利用AI技术创作了一部名为"Cyberlord of the Chips"的电影预告片,将《指环王》与《赛博朋克2077》进行大胆融合,展现出全新的赛博朋克风格中土世界。这展示了AI技术在图像生成领域的飞速发展,引发了关于技术进步与电影艺术独特性的讨论。

【AiBase提要:】
🎥 AI技术创作电影预告片《Cyberlord of the Chips》融合了《指环王》与《赛博朋克2077》的世界观,引起广泛关注。
🌟 利用Midjourney、Runaway和Elevenlabs等工具,重新想象了摧毁魔戒之旅成为寻找致命芯片的冒险,展现出赛博朋克风格的中土世界。
🔮 预告片视觉效果惊人,将中土世界的古老城堡和广袤大地转化为赛博朋克风格的高楼大厦和霓虹灯光,展示了AI技术在电影制作中的潜力。
8、特斯拉股东起诉马斯克将资源转移到其AI公司xAI
在最近的特拉华州诉讼中,特斯拉股东指控马斯克和董事会将公司资源转移到竞争人工智能公司xAI,违反信托义务。马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。股东还援引马斯克转移英伟达人工智能芯片的报道。另有机构投资者指控马斯克利用内幕信息赚取数十亿美元。
【AiBase提要:】
🔍 特斯拉股东起诉马斯克及董事会将资源转移到xAI公司,违反信托义务。
💡 马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。
💰 股东指控马斯克转移英伟达人工智能芯片至社交媒体公司,另有机构投资者指控其利用内幕信息赚取数十亿美元。
9、Spotify成立内部创意机构,测试生成式AI配音广告
Spotify成立内部创意机构Creative Lab,旨在帮助品牌定制营销活动并测试生成式AI广告。公司正致力于开发新的AI工具“Quick Audio”,以帮助广告商创建脚本和配音。通过吸引广告商和利用AI技术,Spotify致力于提升广告营销效果。
【AiBase提要:】
✨ Spotify成立Creative Lab内部创意机构,助力品牌定制营销活动。
🤖 Spotify推出新AI工具“Quick Audio”帮助广告商创建脚本和配音。
🔗 品牌可与Creative Lab团队合作制作视频、音频广告,提升互动广告形式。
10、Mozilla Solo AI更新:无代码 AI 网络生成器
Mozilla推出全新人工智能工具Solo AI,无需编码知识即可创建网站。Solo1.0版本引入动画效果,提升网站视觉吸引力,添加欧洲用户cookie通知横幅。支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。Solo AI承诺轻松创建和发布网站,帮助发展业务。市场上已有多种AI工具可帮助用户创建网站,Solo1.0标志着无编码网站建设进入新阶段。

【AiBase提要:】
🤖 Solo1.0版本引入动画效果,提升网站视觉吸引力。
🍪 添加欧洲用户cookie通知横幅,保持固定标题在顶部。
🚀 支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。
小红书博主用AI画出无价的饭获赞21.9万 网友感动哭
近期,一种新的ChatGPT文生图玩法在海外社交媒体平台上引起了轰动,即在提示词中输入“Makeitmore”,从而引发AI创作出丰富的想象力。这一新形式的内容创作近期持续走红,产生了许多爆款,比如一名男孩因收到圣诞礼物是煤炭而气得用空袭炸了圣诞老人的家,相关视频在YouTube上播放量高达203万次,并获得了13万个赞。同样,另一则小朋友吵架吵到宇宙爆炸的故事在小红书上获得了13.7万个赞。站长网2023-12-27 15:09:460000太糟糕!AI抄袭检测软件不断诬告学生作弊
为了防止学生用AI写论文,有些高校采用了AI抄袭检测软件,但这对有些学生可能是一个噩梦。因为有学生被诬告使用人工智能在论文上作弊,然后在学校调查期间被迫为自己的名字辩护。正如《滚石》杂志报道的那样,加州大学戴维斯分校(UniversityofCaliforniaDavis)即将毕业的大四学生路易丝·斯蒂弗斯(LouiseStivers)的一篇论文被抄袭检查软件Turnitin标记。站长网2023-06-08 07:06:180000苹果代号 Quartz 的基于人工智能的健康辅导付费服务或于 2024 年推出
据彭博社MarkGurman报道,苹果计划在6月展示的iOS17更新将包括几个与健康有关的新功能。将会有一个跟踪情绪的功能,另外苹果计划首次将「健康」应用带到iPad上。站长网2023-04-26 14:23:160000官宣:小米13系列、Redmi K60系列澎湃OS正式版即将推送
快科技112月2日消息,据小米澎湃OS官方在小米社区公告,首批澎湃OS正式版适配机型测试进展顺利,将会在近期正式推送。其中包括小米13系列、RedmiK60至尊版、RedmiK60Pro、RedmiK60,不用机型之间发版机型存在细微差异,但都会在近期逐步推送。届时,这些老用户也能体验到全新的小米澎湃OS了。站长网2023-12-02 15:16:320001CoDA开源:可在3D场景中检测和命名新物体
CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。2.基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。站长网2023-10-08 11:53:330000