今日AI:GPT-4.5意外曝光可能6月发布、UP主借AI识别情绪播放量186万、全球首个AI程序员诞生
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
📢一分钟速看版
▶OpenAI的GPT-4.5Turbo意外曝光,可能6月发布
▶全球首个AI程序员诞生 码农饭碗被砸
▶become-image:人物照片 参考照片可生成目标风格人物照
▶Paper-Piano纸上钢琴:只需一纸就能演奏钢琴
▶全球首部AI生成长电影首映门票售罄
▶B站UP主借AI识别情绪整活《亮剑》名场面播放量186万
▶DragAnything:拖动锚点精准控制视频物体和镜头运动
▶Llama-3基础训练设施公开,用了4.9万个H100
📰🤖📢AI新鲜事
OpenAI的GPT-4.5Turbo意外曝光,可能6月发布
【AiBase提要:】
- 💡 OpenAI 的 GPT-4.5Turbo 被泄露,搜索引擎如 Bing 和 DuckDuck Go 在官方公告前索引了产品页面。
- 💡 GPT-4.5Turbo 被描述为 OpenAI 迄今最快、最准确、最可扩展的模型,具有256,000个token的上下文窗口。
- 💡 传言GPT-4.5Turbo 可能具有视频或3D 功能,但泄露的信息并未提及。
详情:https://www.chinaz.com/2024/0313/1603010.shtml
全球首个AI程序员诞生 码农饭碗被砸
【AiBase 提要:】
⚡ 全球首位 AI 软件工程师 Devin 诞生,掌握全栈技能,云端部署、底层代码、训练和微调 AI 模型。
⚡ Cognition 公司打造 Devin,开发团队拥有10块 IOI 金牌,震撼全网,影响深远。
⚡ Devin 的能力强大,能规划复杂工程任务、构建应用程序、自主查找代码库错误、训练微调 AI 模型。
详情:https://www.chinaz.com/2024/0313/1603012.shtml
谷歌限制Gemini回答与选举相关的查询
【AiBase提要:】
- 🤖 Google 限制 AI 聊天机器人 Gemini 回答与今年将在多个国家举行的选举有关的查询。
- 🌍 这一决定是为了减少在技术部署中潜在的错误。
- 🇺🇸 除美国外,还有几个大国计划进行全国选举,包括南非、俄罗斯和印度。
详情:https://www.chinaz.com/2024/0313/1603006.shtml
全球首部AI生成长电影首映门票售罄
【AiBase提要:】
🎬 "Our T2Remake":全球首部完全由AI生成的电影,翻拍《终结者2》,在洛杉矶首映,引起热议。
🤖 电影内容:AI电影以OpenAI、ChatGPT和AGI为主题,由50位艺术家合作创作,使用多种AIGC工具完成。
🔄 网友反应:社交平台上网友对电影评价较少,一些人评论讽刺,用AI制作反AI的电影,具有讽刺意味。
详情:https://www.chinaz.com/2024/0313/1602989.shtml
B站UP主借AI识别情绪整活《亮剑》名场面播放量186万
【AiBase 提要:】
⭐️ B 站 UP 主 “佛辣西威” 用《亮剑》片段制作 AI 识别情绪视频。
⭐️ 视频播放量达186万,吸引众多网友关注,形成 “梗上加梗” 场面。
⭐️ 利用AI情绪识别技术,UP主在经典剧场面中加入戏剧性和幽默感,增加了视频趣味性。
详情:https://www.chinaz.com/2024/0313/1602977.shtml
Llama-3基础训练设施公开,用了4.9万个H100
【AiBase提要:】
⭐️ Meta 发布两个24KH100GPU 集群,也就是用了49152个H100用于 Llama-3大模型训练
⭐️ Llama-3采用 RoCEv2网络和 Tectonic/Hammerspace 的 NFS/FUSE 网络存储
⭐️ 预计 Llama-3将于4月末或5月中旬上线,将拥有600,000个 H100算力
详情:https://www.chinaz.com/2024/0313/1602961.shtml
2024生成式AI及AIGC应用洞察报告 国内前十AI应用月活用户5000万
【AiBase提要:】
📊 国内前十AI应用月活用户达5000万,相当于ChatGPT日活用户量;
👫 用户性别失衡,男性占比超75%,年龄主要25-35岁;
📈 抖音豆包三个月超越百度文心,月活用户增长40%;
📉 头部AI应用用户活跃率仅约10%,3日留存率平均30%;
🌟 微博和B站在AI内容平台表现突出,TGI接近200。
报告地址:https://qqi2gjmnk4.feishu.cn/wiki/WW53wXigRiEYwvklDCzc3iZVnUh
🤖📱💼AI应用
become-image:人物照片 参考照片可生成目标风格人物照
【AiBase 提要:】
⭐️ 只要上传一张人物照片和一张参考风格的照片就可以将任何人脸图片转换成另一种风格的图像。
⭐️ 可调节生成图片的相关参数,包括保留原始人脸图像的程度、强度控制以及样式应用等。
⭐️ 可以选择添加一些特殊效果,如控制生成图片的噪声程度、固定随机种子以确保再现性等。
项目入口:https://top.aibase.com/tool/cog-become-image
试玩地址:https://replicate.com/fofr/become-image
快手出品!DragAnything:拖动锚点精准控制视频物体和镜头运动
⭐️ 快手科技联合浙大研究团队提出了 DragAnything 方法,利用实体表示实现了对任何物体的运动控制。
⭐️ 可以精确控制物体的运动,生成高质量视频,用户只需在交互过程中绘制一条轨迹。
⭐️该技术技术还可以同时对多个对象实现不同的运动控制。
项目入口:https://top.aibase.com/tool/draganything
Paper-Piano纸上钢琴:只需一纸就能演奏钢琴
【AiBase提要:】
🎹 纸上钢琴,不需要购买真实钢琴,只需一张纸就能演奏音乐。
📹 项目支持最多2个手指,未来将支持更多手指及高度敏感的训练模型。
🛠️ 利用网络摄像头跟踪用户的手指移动,通过识别手指在纸上的位置来模拟钢琴键的按压。
项目入口:https://top.aibase.com/tool/paper-piano
MDTv2开源,Sora 核心组件 DiT 训练提速10倍
【AiBase 提要:】
⭐️ 颜水成 / 程明明团队发布最新版本的论文和代码,开源 Masked Diffusion Transformer V2。
⭐️ 提出 Masked Diffusion Transformer V2在 ImageNet 上达到1.58的 FID score。
⭐️ 利用 mask modeling 表征学习策略大幅加速 DiT 的训练速度。
论文地址:https://arxiv.org/abs/2303.14389
项目入口:https://top.aibase.com/tool/masked-diffusion-transformer-mdt-
AI 图片橡皮擦来了!SPM实现精准擦除特定内容,还能改头换面
【AiBase 提要:】
⭐️ AI 图片橡皮擦技术,可以精准擦除特定概念,保留其他生成内容。
⭐️ 概念半透膜模型 (SPM),可在 Diffusion 架构的 AI 作图模型中实现概念擦除。
⭐️ SPM 技术框架包括轻量化 Adapter、微调策略和动态适配,提高模型擦除效果。
项目入口:https://top.aibase.com/tool/spm
今AI绘画提示词:自拍少女

图源备注:图片由AI生成,图片授权服务商Midjourney
提示词:Photography photo collection,A beautiful18-year-old Chinese girl is holding her phone and taking selfies in front of the camera. She is wearing a Korean white college style sweater, paired with a light blue checkered skirt, and wearing a light blue felt beret on her head, with a well-designed layout --ar16:9--v6.0--style raw
抵制AI剽窃 各行业艺术家共同制定AI使用策略
近日,数字版权组织“为未来而战”与音乐行业劳工组织“联合音乐家和联合工人”合作,发起了AIdayofaction运动,呼吁国会通过立法,阻止企业获得人工智能音乐及其他艺术作品的版权。这一倡议旨在通过禁止唱片公司等利用AI创作音乐进行版权保护,迫使它们继续让人类参与创作。类似的担忧也存在于其他创意产业。站长网2023-10-09 11:48:320000滴滴自动驾驶货运车KargoBot 量产车型在京路测获批
站长之家(ChinaZ.com)10月8日消息:据“滴滴自动驾驶”官方公众号发布消息称滴滴自动驾驶货运KargoBot前装量产L4级卡车获得北京市智能网联汽车政策先行区自动驾驶卡车道路测试通知书,获准在北京开放道路内开展公开道路测试。这是继2022年初,后装车型获得北京市智能网联路测牌照后,KargoBot再次获准在京开展道路测试。站长网2023-10-08 15:40:110001星纪魅族集团完成20亿元天使+轮及A轮融资
星纪魅族宣布完成总计20亿元人民币天使轮及A轮融资,投后估值超100亿元人民币。星纪魅族集团处在智能出行赛道前沿,致力于消费电子产业与汽车产业的跨界融合,并在业内率先提出“手机域”的理念,即超越传统汽车五个域(动力域、底盘域、车身域、座舱域、自动驾驶域)之外的“第六域”,让手机真正融入并成为汽车的一部分,让消费电子为智能汽车赋能。站长网2023-11-16 16:45:340000曾对华为下死手!死对头思科日子难过:又又又要海量裁员了
快科技8月10日消息,据国外媒体报道称,在接连裁员后,思科计划启动今年新一轮裁员,预估影响4000名员工。根据公司提交的年度文件,截至2023年7月,公司员工总数约为84900人(这一数字不包括2月份的裁员)。作为当今全球网络设备领域两大巨头,从2002年盯”上华为开始,思科曾与华为进行了长达10年的战争”。0000多模态大模型MMICL霸榜 支持文本图像视频输入
要点:1、MMICL在多模态能力评测中表现突出,支持文本图像视频三种模态输入。2、采用两阶段训练,可实现“现学现卖”,有效缓解视觉语言模型中的语言偏见。3、已开源可商用的Flan版和仅科研用的Vicuna版,都发布在GitHub。最近,北京交通大学等机构联合推出了新多模态大模型MMICL。它支持文本、图像、视频三种模态的混合输入,在多项多模态能力评测中表现抢眼。站长网2023-09-19 16:41:080001