首页站长资讯AI日报：GPT-4o加持！苹果全线产品进入生成式AI时代；腾讯支持生成多人视频；ChatGPT语音功能升级

AI日报：GPT-4o加持！苹果全线产品进入生成式AI时代；腾讯支持生成多人视频；ChatGPT语音功能升级

站长网2024-06-12 01:00:410阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、苹果WWDC放出深水炸弹 GPT-4o加持Siri 全家桶都上生成式AI

苹果在2024年的全球开发者大会WWDC上宣布了全线产品进入生成式AI时代，推出了全新个性化智能系统Apple Intelligence。更新核心是结合生成式AI模型和用户资料的智能服务，深度集成在iOS18、iPadOS18和macOS Sequoia中。Siri变革，具备更丰富语言理解能力和跨应用执行操作。系统集成ChatGPT提供图像和文档理解功能，新增写作工具和Image Playground等功能。

【AiBase提要:】

🍎 Apple Intelligence整合生成式AI模型和用户资料，提供实用智能服务，深度集成在iOS18、iPadOS18和macOS Sequoia中。

🤖 Siri变革，拥有更丰富语言理解能力，支持跨应用执行操作，用户可通过打字与Siri交流。

📸 系统集成ChatGPT提供图像和文档理解功能，新增写作工具和Image Playground，用户可创建动画、插图或素描风格的图像。

详情：https://www.chinaz.com/2024/0611/1622511.shtml

2、苹果与谷歌 Gemini 模型合作

苹果宣布与谷歌的 Gemini 模型合作，开放第三方模型接入，为用户提供更多选择。Siri 将整合 ChatGPT，用户可在不离开 Siri 的情况下进行会话，并保持隐私控制。苹果更新开发工具包，首次接入 OpenAI 的 ChatGPT，同时发布一系列新特性和更新。

【AiBase提要:】

🍎 苹果与谷歌 Gemini 模型合作，开放第三方模型接入，拓展人工智能生态系统。

🤖 Siri整合ChatGPT，用户可在Siri内进行会话，保持隐私控制。

🚀 苹果更新开发工具包，首次接入OpenAI的ChatGPT，发布iOS18新特性和VisionOS2。

3、iOS18 相册APP大改版：新增AI消除智能筛查缩小搜索范围

苹果在最新发布的iOS18 系统中，对短信功能进行了全面革新。用户不仅可以为短信内容添加下划线和删除线能应用一系列动态文字效果，让每一条信息都充满个性。

【AiBase提要：】

⭐️ 苹果与OpenAI达成合作协议，iOS18 将引入ChatGPT功能。

🤖 GPT- 4 生成的叙述见解对未来股票表现具有信息性。

💬 iPadOS18 系统不仅支持iOS18 上各种自定义功能之外支持自定义应用内的常用功能栏。

iOS18 升级适配机型点此查看：https://www.chinaz.com/2024/0611/1622488.shtml

4、腾讯推全新图生视频模型Follow-Your-Pose-v2

这篇文章介绍了腾讯混元团队联合中山大学、香港科技大学推出的全新图生视频模型"Follow-Your-Pose-v2"，实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。该模型在视频生成领域具有重要意义，应用前景广阔。

【AiBase提要:】

🌟 支持多人视频动作生成，实现多人视频动作的生成，推理耗时更少

🔥 强泛化能力，无论年龄、服装、人种、背景杂乱程度或动作复杂性如何，都能生成高质量视频

💡 正确处理人物遮挡，能生成具有正确前后关系的遮挡画面

项目页:https://top.aibase.com/tool/follow-your-pose

论文地址:https://arxiv.org/pdf/2406.03035

5、MotionFollower:在不改变视频背景的情况复刻人物动作

MotionFollower是一项创新技术，能够将一个视频中的运动复制到另一个视频中的人物上，保持人物外观不变。这项技术应用广泛，可用于电影制作、广告创作、游戏开发等领域。

【AiBase提要:】

⚙️ MotionFollower是创新技术，将视频中的运动复制到另一个人物上，保持外观不变。

🌐 应用场景广泛，可用于电影、广告、游戏等领域。

🎥 MotionFollower处理大范围相机运动视频，实现高质量运动信息转移。

详情链接:https://top.aibase.com/tool/motionfollower

6、Adobe修订服务条款，明确不会用客户作品进行AI训练

Adobe宣布重新修订服务条款，澄清不会用客户作品进行AI训练，目的是赢回用户的信任。这一变化是在一周前的用户强烈抗议后宣布的。

【AiBase提要:】

🛡️ Adobe 修订服务条款，澄清不会用客户作品进行 AI 训练

💬 Adobe 总裁承认应及早澄清服务条款，表示将更加透明

🖼️ 创作者对 Adobe 的担忧仍存，公司努力赢回信任

7、OpenAI升级ChatGPT语音功能使其能够以不同角色的声音说话

OpenAI最新更新了ChatGPT的语音功能，允许用户与聊天机器人交互使用各种AI生成的声音和声音风格。新功能让用户指示AI聊天机器人使用任何语音实时做出响应，提升了互动性和可访问性。

【AiBase提要:】

🔊 ChatGPT现有四种预设声音，可实时优化声音风格。

🗣️ 用户可以要求AI为故事中的角色配音，生成独特声音，如狮子的轰隆隆声。

🔜 OpenAI将在未来几周内推出新的语音功能，提供给所有ChatGPT用户，高级订阅者可优先使用。

8、秒杀Instant3D!上交大推新框架Bootstrap3D 显著提升3D生成能力

上海交大和香港中文大学的研究团队推出了名为Bootstrap3D的新框架，通过结合微调的3D感知多模态大模型，能自动生成高质量多视角图片数据，显著提升3D生成模型的能力。框架的合成数据集已全面开源，供研究人员和开发者免费使用。该框架的关键特点包括数据构建Pipeline、文本提示生成、图像生成、多视图合成、质量筛选和描述重写等。研究团队还提出了训练timestep重安排（TTR）策略，优化去噪过程的不同阶段，解决多视图扩散模型训练中的问题。实验结果表明，使用TTR策略的多视图扩散模型在图像-文本对齐、图像质量和视图一致性方面表现优异，有效提升了多视图生成的效果。

【AiBase提要:】

🔑 数据构建Pipeline: 自动生成多视角图像数据和详细描述文本，是框架的核心创新之一。

🔑 文本提示生成: 使用大语言模型生成创意和多样化的文本提示，为图像生成提供素材。

🔑 多视图合成: 将单视图图像扩展为多视角图像，确保不同视角下的一致性。

详情链接:https://top.aibase.com/tool/bootstrap3d

9、谷歌推出AGREE框架增强大型语言模型生成内容准确性

谷歌研究院推出AGREE框架，旨在增强大型语言模型生成内容和引用的准确性。该框架通过检索相关段落来提高回答准确性，并为用户提供验证信息真实性的途径。核心技术包括训练阶段微调和测试时自适应。实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出。

【AiBase提要:】

🔍 AGREE框架旨在增强大型语言模型生成内容和引用的准确性

🎯 核心技术包括训练阶段微调和测试时自适应

💡 实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出

详情链接:https://arxiv.org/pdf/2311.09533

10、粉笔将于 8 月推出自研AI智能老师

粉笔集团将于 2024 年 8 月推出自研AI智能老师，成为其线上平台提供的AI学习工具之一，首先应用于国家或省级招录类及资格证考试系统班。

【AIBase提要：】

⭐️ 粉笔集团将于 2024 年 8 月推出自研AI智能老师。

⭐️ AI智能老师将成为粉笔线上平台提供的AI学习工具之一。

⭐️ 首先应用于国家或省级招录类及资格证考试系统班。

AI日报GPT4o加持苹果全线产品进入生成式AI时代腾讯支持生成多人视频ChatGPT语音功能升级

0000

评论列表

共(0)条

相关推荐

站长资讯
PopSockets推AI定制工具支持用户定制手机壳
要点:1、PopSockets由人工智能驱动的照片盒和配件设计师推出2、PopSockets在举办竞赛中，奖励最佳人工智能艺术作品3、PopSockets定制器AI基于大型模型引擎
站长网2023-11-08 10:23:32
0000
站长资讯
开源项目Open Interpreter：让AI在操作系统中自我复制
近日，一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目OpenInterpreter，AI实现了在操作系统级别启动自身副本的雏形。这一创新基于多模态大模型，通过截图分析屏幕内容，生成操作计划，并调用系统接口执行任务。这不仅是对任务执行能力的拓展，更是AI自我复制的一次重要尝试。项目地址:https://top.aibase.com/tool/open-interpreter
站长网2024-01-16 14:31:40
0000
站长资讯
号召代理通过人传人林瑞阳、张庭夫妇复出直播被封！
据每日经济新闻报道，11月9日，林瑞阳、张庭夫妇重新回到直播界，他们在直播中号召代理人通过人际传播来传递积极的口碑，照顾好朋友和客户。然而，在直播过程中，直播间被封禁了两次，目前已停止直播。最近，“张庭案”被撤销的消息引起了公众的热议。根据《法治日报·法治周末》报道，张庭和林瑞阳创办的TST庭秘密品牌涉嫌传销，相关公司名下的96套房产曾被冻结。而如今，这些房产的查封被解除。
站长网2023-11-10 09:13:40
0000
站长资讯
谷歌搜索下线快照，互联网似乎真的要没有记忆了
刻在石头上的碑文会风化、写在纸上的文字会腐朽，数千年以来，如何保存知识始终是人类文明的一大关键课题。直到互联网的出现，它成为了一个被认为保存信息的绝妙载体，“互联网是有记忆的”这句话在多年以前更是被奉为圭臬。然而时过境迁，随处可见的“404Notfound”让“互联网没有记忆”已然成为大家公认的事实，如今谷歌的新动作，则又加深了这一刻板印象。
站长网2024-02-13 10:40:27
0000
ZAKER就小米汽车信息泄露致歉：已开除涉事员工永不录用
昨晚，小米官方突然发布声明，指责媒体ZAKER员工包某某和“小白买车”员工关某某在签署保密协议后未经许可泄露了保密拍摄内容。小米表示将追究两人及其所属媒体的泄密责任，包括公开道歉和罚款。今天下午，ZAKER官方发布了一份关于小米汽车信息泄露事件的致歉声明。声明中详细描述了此次员工泄密小米汽车的情况。
站长网站长资讯2023-12-20 16:11:53
0000