AI日报:复旦、百度新模型可生成1小时长视频;全新ChatGPT Windows版本上线;NotebookLM又上2个新功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、面向付费用户!全新ChatGPT Windows版本上线:快捷键即可召唤AI助手
OpenAI推出了全新的ChatGPT Windows应用早期版,为付费用户提供便捷的AI助手体验。用户只需按下Alt Space组合键即可召唤ChatGPT,无需每次打开网页。应用目前仅对付费用户开放,但计划在完善后也会让免费用户有机会体验。虽然测试版应用功能暂不完善,但OpenAI承诺会持续更新以提升用户体验。
【AiBase提要:】
🌟 ChatGPT Windows应用仅对付费用户开放,支持多种付费账号类型。
💡 按下Alt Space组合键即可轻松召唤ChatGPT进行对话,方便快捷。
🔧 测试版应用暂时缺少一些复杂功能,但将持续更新以完善体验。
2、OpenAI重磅发布GPT-4O-Audio-Preview
OpenAI最新推出的GPT-4O-Audio-Preview模型在语音处理领域展现出惊人能力,不仅能生成自然流畅的语音响应,还具备情感分析和语音交互功能,开启了新的人机交互可能性。该模型灵活支持多种模式组合,定价策略反映了音频处理的复杂性。推出将在客户服务、教育、娱乐和辅助技术领域带来革新。
【AiBase提要:】
🔊 模型具备生成自然流畅语音响应能力,支持语音助手和虚拟客服应用。
🎶 具备分析音频情感、语调和音调的能力,适用于情感计算和用户体验分析领域。
🗣 支持语音到语音的互动,为全方位语音交互系统打下基础。
详情链接:https://platform.openai.com/docs/guides/audio/quickstart
3、Google升级AI笔记和研究助手NotebookLM
Google宣布对NotebookLM进行重大升级,增强音频概览功能,让用户更精准引导AI生成对话内容。更新包括自定义音频概览和后台收听功能,提升用户体验。商业版试点计划启动,展望更广泛的应用场景。
【AiBase提要:】
🔊 音频概览功能升级,用户可自定义引导AI对话内容。
🎙️ 新增后台收听功能,用户可同时工作和收听音频。
💼 商业版试点计划启动,企业可提前体验新功能并获得支持。
4、复旦、百度联手打造全新AI模型Hallo2可生成4K超高清 1小时超长视频!
复旦大学和百度公司联合开发的Hallo2AI模型将彻底改变人物动画生成的现状,为电影制作、虚拟助手、游戏开发等领域带来革命性变化。该模型结合了latent diffusion models、Patch-drop数据增强技术、高斯噪声增强技术、VQGAN离散码本预测技术和文本提示控制机制,在生成高质量、长序列人物动画方面表现优异。
【AiBase提要:】
⚙️ Hallo2模型结合了多项创新技术,包括Patch-drop数据增强、高斯噪声增强、VQGAN离散码本预测和文本提示控制机制。
🌟 Hallo2在多个公开数据集上验证,超越现有方法,在生成高质量、长序列人物动画方面表现出色。
🚀 Hallo2模型的发布标志着AI人物动画生成技术迈上新的台阶,未来将进一步优化效率和探索更多应用领域。
详情链接:https://fudan-generative-vision.github.io/hallo2/#/
5、特斯拉Optimus机器人再进化:自主导航、爬楼梯、与人互动成现实
特斯拉最新发布的Optimus机器人展示了令人瞩目的新功能,从自主导航到与人类互动,彰显人工智能和机器人技术的飞速进步。Optimus的自主导航能力、能源管理自主性、负载能力提升等方面都展现出巨大潜力。
【AiBase提要:】
🤖 自主导航能力:Optimus能在复杂环境中自如穿行,多台机器人可协同工作优化导航效率。
🔋 能源管理自主性:Optimus能自动定位充电站实现自主充电,提高工作持续性和效率。
🏋️♂️ 负载能力提升:Optimus能搬运重达11公斤的电池托盘,开拓工业和物流应用新可能性。
6、谷歌人事大调整:Gemini团队并入DeepMind,搜索领导层大变动
谷歌最近进行了重要的领导层变动和团队结构调整,包括K&I团队和Gemini团队。新任领导人的接任和团队整合将对公司的技术发展和AI项目合作产生重大影响。
【AiBase提要:】
🌟 Nick Fox接任谷歌K&I团队新负责人,将继续推动搜索、广告、地理和商务产品的发展。
🔧 Prabhakar Raghavan转任谷歌首席技术官,致力于为公司的技术发展提供方向和支持。
🤖 Gemini团队与谷歌DeepMind整合,旨在加强应用团队和Gemini模型团队之间的合作。
7、上传一段音乐秒变钢琴曲!AMT-APC算法一键生成大师级钢琴演奏
近日,武蔵野大学数据科学学院的研究人员开发了AMT-APC算法,通过结合AMT模型和微调技术,实现更精准生成接近原曲的钢琴演奏版本。该算法突破了现有自动生成钢琴曲技术的局限,提升了音质保真度和表现力。
【AiBase提要:】
⭐ AMT-APC算法利用AMT模型优势,通过微调生成更接近原曲的钢琴演奏版本。
🎵 核心策略包括预训练和微调,使AMT模型能够处理更长音乐片段并生成符合原曲风格的钢琴演奏。
🎹 引入风格向量概念,学习不同演奏风格,提升生成钢琴曲的表现力和音质保真度。
详情链接:https://misya11p.github.io/amt-apc/
8、苹果Siri AI新功能:ChatGPT 集成和图像生成
苹果正致力于为iOS18、iPadOS18和macOS15添加新的Apple Intelligence功能,其中包括ChatGPT集成和图像生成。ChatGPT将为Siri提供更先进的文本和图像生成能力,而Visual Intelligence则将为iPhone16用户提供相机控制按钮功能。iOS18.1、iPadOS18.1和macOS Sequoia15.1预计将于10月28日发布,而iOS18.2、iPadOS18.2和macOS Sequoia15.2的测试版也将很快推出。
【AiBase提要:】
🔍 Siri将集成ChatGPT,提供更先进的文本和图像生成能力。
📸 iPhone16将获得Visual Intelligence功能,通过相机控制按钮提供周围物体信息。
🚀 iOS18.2将支持Image Playground图像生成、Genmoji和Image Wand。
9、仅十亿参数!AI图像生成模型Meissonic
Meissonic是一款仅用十亿个参数就能生成高质量图像的开源AI模型。其采用了并行迭代优化的训练方法,使得在图像生成速度上比传统模型快99%。尽管参数量小,Meissonic在多项测试中表现超越更大模型,且能实现无训练的图像修补和扩展功能。
【AiBase提要:】
🌟 紧凑设计的Meissonic适合普通游戏PC和未来的移动设备使用。
⚡ 采用并行迭代优化的训练方法,Meissonic在图像生成速度上比传统模型快99%。
🏆 尽管参数量小,Meissonic在多项测试中表现超越更大模型,且能实现无训练的图像修补和扩展功能。
详情链接:https://huggingface.co/spaces/MeissonFlow/meissonic
10、Perplexity推出内部知识搜索功能,企业可同时查询内外部数据
Perplexity公司推出了新功能“内部知识搜索”,旨在提高企业工作效率,让用户更便捷获取所需信息。用户上传自选文件,避免低价值信息干扰搜索,提高效率。新增“空间”功能支持团队文件共享与AI助手定制。
【AiBase提要:】
📁 用户只能上传自选文件,避免低价值信息干扰搜索,提高效率。
🔍 Perplexity推出“内部知识搜索”功能,支持用户同时查询内外部数据。
🤝 新增“空间”功能,支持团队文件共享与AI助手定制。
11、自动驾驶公司小马智行拟赴美IPO 估值已超85亿美元
小马智行计划赴美IPO,估值超过85亿美元。公司成立于2016年,专注自动驾驶解决方案,已完成9轮融资超过10亿美元。营收主要来自Robotaxi业务,2024年上半年同比增长86%。
【AiBase提要:】
🌍 小马智行计划赴美IPO,股票代码为“PONY”,估值超过85亿美元。
💰 公司成立于2016年,已完成9轮融资超过10亿美元,估值达85亿美元。
🚖 Robotaxi业务是主要收入来源,2024年上半年同比增长86%。
淘宝能用微信付钱了,我终于等到这一天了。
今天下午刚过三点,差评君冲个咖啡的功夫,朋友圈就被淘宝给占领了。没错,就是淘宝即将全面上线微信支付的事。这消息一出,毫不意外的直接冲上微博热搜,毕竟社交第一和电商巨子强强联合,那真是顶顶又流流啊。不少大媒体也下场跟进,我勒个豆,这阵仗,宁瞅瞅。网友们也直呼巨大改革,终于能省提现费了。不过,要我说的话,说不看好那不可能的,但其实也没想象中那么兴奋。站长网2024-09-06 16:25:500000在AI这个重要问题上,钉钉没有骗我
从ChatGPT发布至今已经整整半年了。在这半年中,国内几乎每家科技大厂都在做自己的生成式AI大模型——就在本周,我又看到了两家科技公司发布“自研通用大模型”。然而,由于监管、技术等多方面原因,国内用户迄今尚未真正享受到生成式AI的成果,也无法分辨谁真谁假、谁在投入而谁又是在玩概念。在我的朋友圈,转发各种“大模型发布会”的人也越来越少了……很重要的原因之一就是对大模型有点审美疲劳,也怕被忽悠了。站长网2023-06-01 14:54:570001俞敏洪、董宇辉退意隐现,东方甄选必须加速了
这个618,东方甄选上热搜的次数有点多。5月31日,在物美创始人张文中的直播间,张文中提及向俞敏洪学习直播带货经验时,俞敏洪称“东方甄选现在做得乱七八糟,没有任何向你提建议的本领”。6月9日,在新节目《我爱我,很棒》中,董宇辉提到自己非常抗拒卖东西,到今天也不享受带货主播这份工作,同时非常反感被称作“网红”,觉得这不是一个褒义词。站长网2024-06-17 16:13:200001动效、游戏体验大提升!小米澎湃OS体验增强版Beta开始推送
快科技9月23日消息,据小米用户反馈,目前小米澎湃OS体验增强版Beta已经开始推送。该版本是完全独立于小米澎湃OS主线版本之外的特殊分支版本,是为了持续基础体验,深入底层优化特意开设的实验田”,并针对不同领域的体验优化,规划了多次更新计划。当充分完成技术验证后,会将其中的部分领先能力逐步合入澎湃OS主线版本中。0000华为回应问界商标转让赛力斯:帮助车企造好车 卖好车
站长之家(ChinaZ.com)7月3日消息:近日,赛力斯汽车有限公司宣布了一项重大战略举措,计划斥资25亿元人民币收购华为及其关联方持有的“问界”系列文字与图形商标等知识产权。此举标志着双方合作关系的又一里程碑,而华为方面则迅速回应,承诺将持续支持赛力斯在“问界”品牌上的发展,共同推动智能网联汽车行业的进步。站长网2024-07-03 08:04:390000