AI日报:神秘AI模型Red_panda横空出世;xAI为Grok添加图像理解功能;更多特效的PixVerse V3发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、生图能力超越Flux1.1Pro!神秘AI模型红熊猫Red_panda横空出世
一款名为red_panda的神秘AI图像生成模型在Artificial Analysis的基准测试中表现惊人,超越了行业领军企业的产品。其在文本转图像测试中以1244分的成绩领跑,展现出技术优势和高效率。红熊猫的真实感图像超越了传统AI作品,展现出色的文本提示理解和执行能力。红熊猫的横空出世推动了行业标准的提升,引发关注。
【AiBase提要:】
🚀 红熊猫AI模型在基准测试中以1244分的成绩领跑,超越行业领军企业产品
💡 红熊猫生成的图像具有极高的真实感,超越了传统AI作品
🔗 红熊猫的横空出世推动了行业标准的提升,引发关注
详情链接:https://artificialanalysis.ai/text-to-image/arena
2、xAI为Grok添加图像理解功能 还能看懂梗图的幽默
马斯克旗下xAI公司最新为其AI模型Grok增添了图像理解功能,用户可上传图片向AI助手提问。马斯克展示了Grok的新能力,包括理解图片内容和幽默元素。功能仍在早期阶段,团队将持续改进。xAI通过与黑森林实验室合作,新增多模态理解功能,提升用户体验和开发者API。
【AiBase提要:】
✨ 图像理解功能:Grok现可理解图片内容和幽默元素。
🚀 功能扩展:自推出Grok-2模型以来,xAI不断扩展功能,与FLUX.1模型合作实现图像生成。
🔥 用户体验提升:新增多模态理解功能,马斯克承诺很快实现文档处理需求。
3、又要被玩坏了!PixVerse V3升级:不但能玩AI捏捏,还能让杯子长腿
PixVerse V3版本带来了全方位的功能升级,让创作者体验更专业、更有趣。从视频特效到风格功能再到视频延长,都有显著提升,为内容创作者提供更全面、更专业的视频创作平台。
【AiBase提要:】
✨ 视频特效升级:新增万圣节主题特效,操作简单直观,丰富节日创作素材。
🎨 风格功能升级:支持动漫、3D动画、粘土和写实四种风格,可应用于不同场景。
🔥 视频延长功能:用户可额外增加5-8秒内容,精确控制新增片段内容走向,生成连贯动作画面。
详情链接:https://app.pixverse.ai/home
4、谷歌Gmail网页版上线AI功能 “帮我写”,邮件撰写润色更轻松
谷歌在网页版Gmail上推出了“帮我写”功能,利用Gemini AI帮助用户撰写和修改邮件,提升了邮件撰写的便利性和效率。这一功能仅限于订阅Google One AI Premium或拥有Gemini Workspace插件的用户使用,为用户提供了个性化的邮件撰写体验。新增的“润色”快捷方式让用户可以快速优化邮件内容,进一步提升邮件的质量。
【AiBase提要:】
🌟 “帮我写”功能上线网页版Gmail,利用Gemini AI帮助用户撰写和修改邮件。
🔑 仅限订阅Google One AI Premium或拥有Gemini Workspace插件的用户使用。
⚡ 新增“润色”快捷方式,方便用户快速优化邮件内容。
5、视频理解领域杀出黑马!Video-XL这款模型能处理长达一小时的视频!
Video-XL是一款专为高效的小时级视频理解而设计的超长视觉语言模型,利用“视觉上下文潜在摘要”技术将长视频内容压缩成精简形式,提高效率并保留关键信息。在多个长视频理解基准测试中表现出色,效率和效果平衡。应用前景广阔,可用于电影摘要、监控异常检测和广告植入识别。
【AiBase提要:】
🚀 Video-XL是专为处理超长视频而设计的超长视觉语言模型,利用视觉上下文潜在摘要技术压缩视频内容。
💡 Video-XL在多个长视频理解基准测试中表现领先,尤其在VNBench测试中准确率高出近10%。
⚙️ Video-XL在效率和效果之间取得平衡,在单个80GB GPU上处理2048帧视频,同时保持近95%的准确率。
详情链接:https://github.com/VectorSpaceLab/Video-XL
6、苹果iOS18.2确认于12月推送 将为Siri植入ChatGPT
苹果公司宣布将在12月推出iOS18.2、iPadOS18.2和macOS Sequoia15.2系统更新,引入革命性的AI功能升级,包括Siri首次接入ChatGPT,为用户带来更智能、更便捷的体验。系统强调用户隐私保护,整合顶级AI技术与硬件优势,展现了苹果在AI领域的雄心。
【AiBase提要:】
🔍 Siri将首次接入ChatGPT,用户无需额外注册账户即可免费使用
📝 ChatGPT整合到系统写作工具中,提升创作能力
🔒 苹果采取严格安全措施保护用户隐私,不保存ChatGPT使用记录
7、报道称,Meta 正在研发自家AI搜索引擎,减少对谷歌依赖
最近,据报道,Meta 正在开发一款全新的人工智能搜索引擎,旨在减少对谷歌和微软的依赖。这一举措将为Meta的聊天机器人提供AI生成的时事摘要,进一步深入信息获取领域。科技巨头之间的竞争日益激烈,Meta、苹果、OpenAI等公司都在推出创新产品以满足用户需求。
【AiBase提要:】
🌐 Meta 正在开发AI搜索引擎,减少对谷歌的依赖。
🤖 新的搜索引擎将为Meta的聊天机器人提供AI生成的时事摘要。
📰 Meta与路透社达成合作,让聊天机器人可使用其新闻文章进行回答。
8、智源推出全能视觉生成模型 OmniGen 集多项能力于一体
北京智源人工智能研究院(BAAI)推出全新全能视觉生成模型OmniGen,标志着图像生成领域重大突破。OmniGen以统一性、简单性和跨任务知识迁移能力著称,可处理多种图像生成任务,包括文生图、图像编辑、主题驱动生成和视觉条件生成。模型简化架构、用户友好操作,无需插件或复杂步骤,能有效跨任务迁移知识,展示新颖功能。
【AiBase提要:】
🌟 OmniGen模型集多项能力于一体,处理多种图像生成任务。
🔑 模型简化架构、用户友好操作,无需额外插件,可完成复杂任务。
💡 OmniGen开源权重和代码,构建大规模统一图像生成数据集X2I,推动通用图像生成领域发展。
详情链接:https://arxiv.org/pdf/2409.11340
9、突破性开源项目:手机也能运行的轻量级数字人来了
近日,一个名为Ultralight-Digital-Human的开源项目成功解决了数字人技术在移动端的部署难题,让普通智能手机也能实时运行数字人应用,为相关技术的普及带来新的可能。该项目采用了创新的深度学习技术,通过算法优化和模型压缩,成功将庞大的数字人系统瘦身到可以在移动设备上流畅运行的程度。
【AiBase提要:】
🔑 创新深度学习技术实现数字人在移动设备上流畅运行
🔑 集成Wenet和Hubert音频特征提取方案,提升数字人唇形同步效果
🔑 提供完整的训练流程文档,让开发者轻松训练自己的数字人模型
详情链接:https://github.com/anliyuan/Ultralight-Digital-Human
10、环球音乐与AI公司携手打造 “有道德” 的AI 音乐生成模型KLayMM
环球音乐集团与Klay Vision合作开发道德音乐生成模型KLayMM,旨在推动可持续AI音乐创作。这一合作标志着音乐行业对AI技术的重视,展示了新的音乐创作方向。
【AiBase提要:】
🎶 UMG与Klay Vision合作推出KLayMM,尊重版权与艺术家权益。
🤝 模型将与音乐行业合作,确保AI内容准确归属与可持续发展。
🌍 Klay Vision建立全球生态系统,促进AI音乐创作与版权变现。
11、苹果推配备M4的新款iMac Apple Intelligence解锁Mac更多可能
苹果公司发布了全新的iMac,搭载强大的M4芯片和Apple Intelligence,保持超薄设计。新款iMac将于11月8日正式发售,起价1299美元。M4芯片带来显著性能提升,日常生产力提升1.7倍,处理照片编辑和游戏速度提升2.1倍。Apple Intelligence带来全新体验,结合生成模型和隐私保护功能,解锁Mac新方式。
【AiBase提要:】
🚀 M4芯片带来显著性能提升,日常生产力提升1.7倍,处理照片编辑和游戏速度提升2.1倍。
💡 Apple Intelligence结合生成模型和隐私保护功能,为用户解锁Mac新方式。
🎨 新款iMac提供七种鲜艳配色,24英寸4.5K视网膜显示屏、1200万像素Center Stage摄像头等功能。
12、周鸿祎:AI不该成为超级神明,而应是人类的茶叶蛋
周鸿祎在新浪新闻探索大会上分享了对人工智能发展的独特见解,强调AI应赋能而非简单替代人类,呼吁降低AI应用成本实现产业重塑。他认为中国应走专业化发展道路,与具体行业需求结合,提升生产效率。
【AiBase提要:】
🧠 AI不应成为宇宙超级无敌存在,而应降低应用成本实现产业重塑。
🔮 AI技术目前仅能模拟人脑部分功能,短期内不构成威胁。
💡 AI发展应专业化,如DeepMind的AlphaGo和AlphaFold,在特定领域发挥优势。
13、预测:生成式AI将产生大量电子废物
近日,剑桥大学和中国科学院的研究人员发表论文指出,到2030年,生成式AI可能每年产生相当于超过10亿部iPhone的电子废物。研究旨在提前了解技术发展带来的后果,提出减少废物的建议。
【AiBase提要:】
🌍 生成式AI预计每年产生超过10亿部iPhone的电子废物
♻️ 减少废物产生的建议包括降级处理和再利用组件
📊 通过采取措施,电子废物产生量可减少16%到86%
苹果发布Apple Vision Pro开发者工具 使用Unity创作的app可直接移植
凤凰网科技讯(作者/阎烁)6月22日消息,苹果发布为AppleVisionPro打造空间体验的开发者工具,全球Apple开发者将可利用AppleVisionPro的无限空间打造一类全新的空间计算app。同时苹果表示下个月起,开发者可以将Unityapp移植到AppleVisionPro,全面利用其功能特性。站长网2023-06-23 23:42:180000俞敏洪回应“小作文”风波:公司管理漏洞很大,坚决抵制饭圈文化
新东方创始人俞敏洪在抖音发布视频声明,针对近期“小作文”风波做出回应。在视频中,俞敏洪表示小编的行为缺乏职业精神,也揭示了公司管理存在漏洞。此外,他强调东方甄选拥有的是对主播热爱的网友和粉丝,并坚决抵制所谓的“饭圈文化”。在视频中,俞敏洪深情呼吁大家用理性的言论追随喜欢的主播,强调这是对他们最好的关爱方式。他关切地指出:“孩子们都还年轻,网络上不恰当的表达也许会对他们的心理造成伤害。”0000英伟达市值反超苹果 首次突破3万亿美元
在全球科技巨头的竞争中,英伟达凭借卓越的业绩表现和强劲的市场势头,市值首次突破3万亿美元,成功超越苹果,紧随微软之后,位列全球市值第二高的公司。这一历史性的里程碑是在今日凌晨达成的,英伟达股价大涨5%,刷新了历史新高。收盘时,英伟达股价上涨5.16%,达到每股1224.4美元,市值稳稳地站在了3.01万亿美元的高地上。这使得英伟达成为继微软和苹果之后,第三家市值超过3万亿美元的公司。站长网2024-06-06 14:11:050000GRUP MEDIAPRO宣布与微软成立AI合成媒体实验室
GRUPMEDIAPRO在ISE展会的框架内,宣布与微软合作,启动了一个人工智能和合成媒体实验室。这是两家公司为了为音像行业开发解决方案而共享技术和商业知识的一个重要步骤。GRUPMEDIAPRO和微软的合作基于以人为本的理念,同时承诺在人工智能解决方案的构思、开发、部署和使用中遵守所有法律义务和道德原则。站长网2024-01-31 15:27:450000亚马逊年度股东信:正大力投资大型语言模型和生成式 AI
亚马逊于AWS官网宣布推出AmazonBedrock服务和AmazonTitan大语言模型。开发者可以用能够生成文本的人工智能系统来增强他们的软件,这与微软支持的创业公司OpenAI提供的流行的ChatGPT聊天机器人背后的引擎相似。站长网2023-04-14 10:04:210000