首页站长资讯AI日报：复旦、百度新模型可生成1小时长视频；全新ChatGPT Windows版本上线；NotebookLM又上2个新功能

AI日报：复旦、百度新模型可生成1小时长视频；全新ChatGPT Windows版本上线；NotebookLM又上2个新功能

站长网2024-10-18 23:59:570阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、面向付费用户!全新ChatGPT Windows版本上线:快捷键即可召唤AI助手

OpenAI推出了全新的ChatGPT Windows应用早期版，为付费用户提供便捷的AI助手体验。用户只需按下Alt Space组合键即可召唤ChatGPT，无需每次打开网页。应用目前仅对付费用户开放，但计划在完善后也会让免费用户有机会体验。虽然测试版应用功能暂不完善，但OpenAI承诺会持续更新以提升用户体验。

【AiBase提要:】

🌟 ChatGPT Windows应用仅对付费用户开放，支持多种付费账号类型。

💡 按下Alt Space组合键即可轻松召唤ChatGPT进行对话，方便快捷。

🔧 测试版应用暂时缺少一些复杂功能，但将持续更新以完善体验。

2、OpenAI重磅发布GPT-4O-Audio-Preview

OpenAI最新推出的GPT-4O-Audio-Preview模型在语音处理领域展现出惊人能力，不仅能生成自然流畅的语音响应，还具备情感分析和语音交互功能，开启了新的人机交互可能性。该模型灵活支持多种模式组合，定价策略反映了音频处理的复杂性。推出将在客户服务、教育、娱乐和辅助技术领域带来革新。

【AiBase提要:】

🔊 模型具备生成自然流畅语音响应能力，支持语音助手和虚拟客服应用。

🎶 具备分析音频情感、语调和音调的能力，适用于情感计算和用户体验分析领域。

🗣 支持语音到语音的互动，为全方位语音交互系统打下基础。

详情链接:https://platform.openai.com/docs/guides/audio/quickstart

3、Google升级AI笔记和研究助手NotebookLM

Google宣布对NotebookLM进行重大升级，增强音频概览功能，让用户更精准引导AI生成对话内容。更新包括自定义音频概览和后台收听功能，提升用户体验。商业版试点计划启动，展望更广泛的应用场景。

【AiBase提要:】

🔊 音频概览功能升级，用户可自定义引导AI对话内容。

🎙️ 新增后台收听功能，用户可同时工作和收听音频。

💼 商业版试点计划启动，企业可提前体验新功能并获得支持。

4、复旦、百度联手打造全新AI模型Hallo2可生成4K超高清 1小时超长视频!

复旦大学和百度公司联合开发的Hallo2AI模型将彻底改变人物动画生成的现状，为电影制作、虚拟助手、游戏开发等领域带来革命性变化。该模型结合了latent diffusion models、Patch-drop数据增强技术、高斯噪声增强技术、VQGAN离散码本预测技术和文本提示控制机制，在生成高质量、长序列人物动画方面表现优异。

【AiBase提要:】

⚙️ Hallo2模型结合了多项创新技术，包括Patch-drop数据增强、高斯噪声增强、VQGAN离散码本预测和文本提示控制机制。

🌟 Hallo2在多个公开数据集上验证，超越现有方法，在生成高质量、长序列人物动画方面表现出色。

🚀 Hallo2模型的发布标志着AI人物动画生成技术迈上新的台阶，未来将进一步优化效率和探索更多应用领域。

详情链接:https://fudan-generative-vision.github.io/hallo2/#/

5、特斯拉Optimus机器人再进化:自主导航、爬楼梯、与人互动成现实

特斯拉最新发布的Optimus机器人展示了令人瞩目的新功能，从自主导航到与人类互动，彰显人工智能和机器人技术的飞速进步。Optimus的自主导航能力、能源管理自主性、负载能力提升等方面都展现出巨大潜力。

【AiBase提要:】

🤖 自主导航能力:Optimus能在复杂环境中自如穿行，多台机器人可协同工作优化导航效率。

🔋 能源管理自主性:Optimus能自动定位充电站实现自主充电，提高工作持续性和效率。

🏋️‍♂️ 负载能力提升:Optimus能搬运重达11公斤的电池托盘，开拓工业和物流应用新可能性。

6、谷歌人事大调整:Gemini团队并入DeepMind，搜索领导层大变动

谷歌最近进行了重要的领导层变动和团队结构调整，包括K&I团队和Gemini团队。新任领导人的接任和团队整合将对公司的技术发展和AI项目合作产生重大影响。

【AiBase提要:】

🌟 Nick Fox接任谷歌K&I团队新负责人，将继续推动搜索、广告、地理和商务产品的发展。

🔧 Prabhakar Raghavan转任谷歌首席技术官，致力于为公司的技术发展提供方向和支持。

🤖 Gemini团队与谷歌DeepMind整合，旨在加强应用团队和Gemini模型团队之间的合作。

7、上传一段音乐秒变钢琴曲!AMT-APC算法一键生成大师级钢琴演奏

近日，武蔵野大学数据科学学院的研究人员开发了AMT-APC算法，通过结合AMT模型和微调技术，实现更精准生成接近原曲的钢琴演奏版本。该算法突破了现有自动生成钢琴曲技术的局限，提升了音质保真度和表现力。

【AiBase提要:】

⭐ AMT-APC算法利用AMT模型优势，通过微调生成更接近原曲的钢琴演奏版本。

🎵 核心策略包括预训练和微调，使AMT模型能够处理更长音乐片段并生成符合原曲风格的钢琴演奏。

🎹 引入风格向量概念，学习不同演奏风格，提升生成钢琴曲的表现力和音质保真度。

详情链接:https://misya11p.github.io/amt-apc/

8、苹果Siri AI新功能:ChatGPT 集成和图像生成

苹果正致力于为iOS18、iPadOS18和macOS15添加新的Apple Intelligence功能，其中包括ChatGPT集成和图像生成。ChatGPT将为Siri提供更先进的文本和图像生成能力，而Visual Intelligence则将为iPhone16用户提供相机控制按钮功能。iOS18.1、iPadOS18.1和macOS Sequoia15.1预计将于10月28日发布，而iOS18.2、iPadOS18.2和macOS Sequoia15.2的测试版也将很快推出。

【AiBase提要:】

🔍 Siri将集成ChatGPT，提供更先进的文本和图像生成能力。

📸 iPhone16将获得Visual Intelligence功能，通过相机控制按钮提供周围物体信息。

🚀 iOS18.2将支持Image Playground图像生成、Genmoji和Image Wand。

9、仅十亿参数!AI图像生成模型Meissonic

Meissonic是一款仅用十亿个参数就能生成高质量图像的开源AI模型。其采用了并行迭代优化的训练方法，使得在图像生成速度上比传统模型快99%。尽管参数量小，Meissonic在多项测试中表现超越更大模型，且能实现无训练的图像修补和扩展功能。

【AiBase提要:】

🌟 紧凑设计的Meissonic适合普通游戏PC和未来的移动设备使用。

⚡ 采用并行迭代优化的训练方法，Meissonic在图像生成速度上比传统模型快99%。

🏆 尽管参数量小，Meissonic在多项测试中表现超越更大模型，且能实现无训练的图像修补和扩展功能。

详情链接:https://huggingface.co/spaces/MeissonFlow/meissonic

10、Perplexity推出内部知识搜索功能，企业可同时查询内外部数据

Perplexity公司推出了新功能“内部知识搜索”，旨在提高企业工作效率，让用户更便捷获取所需信息。用户上传自选文件，避免低价值信息干扰搜索，提高效率。新增“空间”功能支持团队文件共享与AI助手定制。

【AiBase提要:】

📁 用户只能上传自选文件，避免低价值信息干扰搜索，提高效率。

🔍 Perplexity推出“内部知识搜索”功能，支持用户同时查询内外部数据。

🤝 新增“空间”功能，支持团队文件共享与AI助手定制。

11、自动驾驶公司小马智行拟赴美IPO 估值已超85亿美元

小马智行计划赴美IPO，估值超过85亿美元。公司成立于2016年，专注自动驾驶解决方案，已完成9轮融资超过10亿美元。营收主要来自Robotaxi业务，2024年上半年同比增长86%。

【AiBase提要:】

🌍 小马智行计划赴美IPO，股票代码为“PONY”，估值超过85亿美元。

💰 公司成立于2016年，已完成9轮融资超过10亿美元，估值达85亿美元。

🚖 Robotaxi业务是主要收入来源，2024年上半年同比增长86%。

AI日报复旦 百度新模型可生成1小时长视频全新ChatGPTWindows版本上线NotebookLM又上2个新功能

0000

评论列表

共(0)条

相关推荐

站长资讯
研究:AI在诊断前预测了三分之一的乳腺癌病例
划重点:1.人工智能通过分析X光检查数据，能在乳腺癌诊断前两年预测三分之一的病例。2.研究结果表明，AI在乳腺癌早期诊断中有巨大潜力，尤其对于筛查检测和间隔检测的病例。3.尽管研究充满希望，但专家强调AI应与医疗专业知识相结合，而不是替代医生的经验。一项最新的研究发现，人工智能（AI）具备在乳腺癌诊断前进行早期预测的能力，为患者带来了新的希望。
站长网2023-10-26 14:55:53
0000
腾讯拟6个亿卖掉腾讯动漫中国最大正版动漫网站
快科技12月11日消息，阅文集团发布公告称，计划以6亿元人民币收购腾讯动漫。具体包含腾讯动漫App平台平台资产、动画项目、影视项目及米橙子（腾讯动漫制作公司）的90%股权。腾讯动漫官网表示，近年来，腾讯动漫已经发展成为中国最大的原创及正版网络动漫平台。收购完成后，阅文将整合腾讯动漫有影响力的头部IP和成熟的动漫产能，进一步提升IP运营效率，阅文的IP生态链或将迎来扩容升级。
站长网站长资讯2023-12-11 22:06:20
0000
站长资讯
Nvidia推出FlexiCubes，利用生成式AI创建高质量3D网格
文章概要:1.Nvidia推出了FlexiCubes，这是一种利用AI生成各种3D应用所需3D网格的新方法。2.FlexiCubes可以与物理引擎集成，轻松地在3D模型中创建像百吉饼这样柔软的对象。3.这种创新性的网格生成方法有望改变AI流水线，为广泛的应用提供高质量的网格。Nvidia推出了一种全新使用AI生成3D网格的方式FlexiCubes，它可以为广泛的3D应用生成3D网格。
站长网2023-09-01 15:24:13
0000
站长资讯
中国石化与百度签署战略合作协议涉及AI大模型创新等领域
据百度官方消息，6月14日，中国石化与百度签署战略合作框架协议。双方将在石化行业人工智能、互联网新业态、数字化转型升级等领域深化合作，提高智能制造水平，赋能实体经济，推动双方在合作共赢中实现高质量发展。
站长网2023-06-16 16:20:42
0000
站长资讯
东方甄选，不会再有董宇辉
尽管坊间关于董宇辉单飞的传闻纷纷，但靴子落地后，事情的解决方案还是让围观群众们吃惊不已。昨日晚间，东方甄选发布公告称，董宇辉已决定不再担任公司雇员及公司一个合并联属实体的高级管理层，并于7月25日生效。这位大主播从东方甄选离职的同时，与辉同行这家全资子公司从东方甄选剥离、真正独立出来，董宇辉收购并持有与辉同行100%的股权，成为这家公司的老板。
站长网2024-07-27 13:35:39
0004