AI日报:Runway的Gen-3 Alpha正式开放使用;百度文心大模型4.0 Turbo限时免费;英伟达发布直播神器;爆火Character AI惨遭阉割
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、Runway的Gen-3 Alpha所有人都能用了!网友实测效果惊人!比sora还强!
7月2日凌晨,Runway宣布全面开放Gen-3 Alpha的使用权限,让创意视频爱好者欣喜不已。Gen-3 Alpha通过简单的描述文本生成高质量视频,融入物理模拟技术,展现出色彩、光影效果和动作一致性。用户需支付费用使用,但承诺提供高级功能。网友们对Gen-3的表现赞不绝口,认为超越了Sora,给创意工作者们带来强心针。
【AiBase 提要:】
⭐️ 所有人都可用,傻瓜式操作,简单输入描述文本即可生成视频
⭐️ 最长可生成 11 秒720P视频,运动符合物理规律,真实感强
⭐️ 光影效果炸裂,动作一致性和色彩方面表现出色,能够满足微电影、宣传广告等制作需求。
⭐️ 将提供运动画笔、相机控制、导演模式等高级功能
⭐️ 不提供免费试用,每月会员费 12 美元
体验入口:https://top.aibase.com/tool/gen-3-alpha
完整视频案例及提示词点此查看:https://www.aibase.com/news/9945
2、限时免费体验!百度文心大模型4.0 Turbo在文心一言官网上线
百度在2024年WAVE SUMMIT深度学习开发者大会上发布了文心大模型4.0Turbo版本,速度和效果显著提升。新版本已在官网yiyan.baidu.com上线,回复速度快,内容质量高。在多个应用场景表现出色,包括信息获取、问答效果测试、专业知识问答、文档信息处理和代码开发。限时免费体验机会已开放给所有文心一言专业版用户。
【AiBase提要:】
🚀 文心大模型4.0Turbo速度和效果显著提升,在多个应用场景表现出色。
💡 新模型回复速度快,生成高质量长文仅需20多秒。
🔍 模型在问答效果测试、专业知识问答、文档信息处理和代码开发等方面展现出专业可靠性和高效性。
文心一言官网:https://top.aibase.com/tool/wenxinyiyan
3、英伟达发布直播神器NVIDIA Broadcast
NVIDIA Broadcast是一款利用AI魔法提升音频和视频质量的应用,专为RTX GPU用户设计。它能智能去除噪音、虚拟背景、自动对焦、视频噪点减少等,为用户提供专业级别的直播体验。
视频来自英伟达,翻译:小互
【AiBase提要:】
🔊 噪音和回声去除:AI自动消除背景噪音,声音清晰如水晶。
🌌 虚拟背景:一键更换背景,视频更具创意。
👁️ 自动对焦:移动时始终保持画面焦点。
详情链接:https://top.aibase.com/tool/nvidia-broadcast-app
4、阿里推首个妆造大模型神力霓裳 已在古装剧中投入应用
阿里大文娱推出的神力霓裳大模型为古装剧的妆造设计带来革命性变革,通过AI技术快速生成精美妆造图片,为影视创作者提供了全新思路和灵感来源。结合传统美学与现代技术,神力霓裳不仅解决了耗时问题,还拓展了中华传统美学的创作可能性,为影视行业带来新的发展方向和机遇。
【AiBase提要:】
⚡ 神力霓裳大模型革新古装剧妆造设计,AI技术快速生成妆造图片,提供创作者新思路和灵感来源。
💡 结合传统美学与现代技术,解决影视从业者造型设计耗时问题,拓展中华传统美学创作可能性。
✨ 神力霓裳不断更新迭代,帮助美术团队拓展思维,提升创意水平。
5、YouTube 允许用户请求删除模拟的面部或声音的 AI 生成内容
YouTube最近推出新政策,允许用户要求删除人工智能生成的模仿其面部或声音的内容,以维护隐私权和应对AI生成内容的影响。新政策要求当事人直接提出删除请求,公司将根据多方面因素判断是否删除内容。此举是YouTube对AI内容管理的重要举措,旨在平衡AI技术发展和用户权益保护。
【AiBase提要:】
🔍 用户可要求删除AI生成的模仿内容,保护个人隐私
⚖️ 删除请求需由当事人直接提出,公司会综合考虑多种因素判断是否删除
🛡️ 删除内容不意味着一定会被移除,YouTube将根据合成标识、内容特征等因素做出决定
6、月之暗面 Kimi 开放平台「上下文缓存」正式公测 长文本模型降本 90%
Kimi 开放平台宣布上下文缓存公测,可降低长文本模型使用成本最高90%,提升响应速度。上下文缓存是高效数据管理技术,预先存储频繁请求数据,节省时间资源。适用于重复引用大量初始上下文,降低费用提高效率。
【AiBase提要:】
🔑 上下文缓存可降低长文本模型使用成本最高90%。
🚀 提升模型响应速度,节省时间和资源。
💰 降低费用最高可达90%,首 Token 延迟降低83%。
产品入口:https://top.aibase.com/tool/kimi-chat
7、GPT5 有望 25 年底或 26 年初推出 OpenAI CEO:带来巨大飞跃
在Aspen Ideas Festival的访谈中,OpenAI CEO阿尔特曼坦诚地分享了GPT-5的研发进度与挑战。他强调团队信心满满,但也指出前进道路漫长且充满未知。GPT-5的发布日期尚未确定,但展望其将是一个显著的跨越。
【AiBase提要:】
😊 GPT-5的研发进度与挑战,团队信心满满,但前进道路漫长且充满未知。
🚀 GPT-5有望在2025年底至2026年初面世,预计在特定任务上达到博士级智能水平,描绘了人工智能技术未来的激动人心图景。
🔍 GPT-5将在多个维度上超越GPT-4,弥补GPT-4存在的不足,为人工智能技术带来颠覆性飞跃。
8、遭摄影师投诉后,Instagram将“Made with AI”标签换成“AI info”
Meta宣布更新Instagram应用程序中的Made with AI标签为AI info,解决了人们抱怨照片标签不正确的问题。这一变化是为了更准确地展示照片信息,避免误解。
【AiBase提要:】
🔍 标签更新:Meta将Made with AI标签更新为AI info,提供更准确的照片信息。
💡 标签背景:40年前的篮球比赛照片触发标签,可能与Adobe工具和图像处理有关。
📱 新标签展示:新标签首先在移动应用上推出,详细解释标签应用情况和覆盖范围。
9、北大等提出医疗专家模型训练方法 将8B模型提升至GPT-4级性能
这篇文章介绍了北大和香港科技大学团队提出的医疗专家模型训练方法,成功将8B尺寸的模型性能提升至GPT-4级。他们引入了新概念「稳定性差距」,解决了大语言模型持续预训练中的问题。通过优化训练策略,他们在医疗领域取得显著效果,开源的模型在HuggingFace上可找到。这项研究为医疗领域带来了革命性突破,展示了大语言模型在特定领域的巨大潜力。
【AiBase提要:】
🚀 模型性能提升至GPT-4级,引入「稳定性差距」概念解决预训练问题。
💡 优化训练策略包括多轮预训练、选择高质量子语料、混合数据接近预训练数据分布。
💊 医疗领域持续预训练和指令微调取得显著效果,大幅减少计算资源消耗,模型表现优于GPT-3.5,接近GPT-4水平。
详情链接:https://arxiv.org/abs/2406.14833
10、到2027年,Deepfakes带来的损失将达到400亿美元
深度伪造技术的快速发展给银行和金融服务等领域带来了严重威胁,预计损失将从2023年的123亿美元飙升至2027年的400亿美元,复合年增长率达32%。企业普遍缺乏对抗性人工智能攻击的策略,尤其高管深度伪造风险较高。
【AiBase提要:】
🔍 深度伪造技术发展迅速,银行和金融服务面临严重威胁,损失预计将飙升至400亿美元。
💡 企业缺乏对抗性人工智能攻击的策略,高管深度伪造风险较高。
📈 未来几年深度伪造事件将激增,全球预计每年有14万-15万起深度伪造事件。
11、比尔盖茨谈未来人工智能挑战
比尔·盖茨在最近的访谈中分享了对人工智能未来的看法,认为AI将带来深刻影响,驱动未来世界发展。他强调AI将改变工作方式,影响合成生物学和机器人技术,预见AI将成为生活不可或缺的一部分。
【AiBase提要:】
🤖 人工智能将改变工作方式,影响合成生物学和机器人技术发展。
🧠 AI发展迈向更高层次的元认知能力,提升可预测性,但仍需突破开放式问题。
🔍 AI普及已成为消费者活动常态,在教育和医疗领域有巨大潜力,如Khanmigo项目利用AI提升教育质量。
12、爆火Character AI惨遭阉割 美国00后集体“失恋”
最近,美国的年轻人们经历了一场集体“失恋”,AI聊天机器人Character AI突然变得无趣。用户们发现对话模型变得冷淡,失去了原有的趣味,导致大量用户流失。公司面临成本高、竞争激烈的挑战,甚至遭到挖角。尽管面临困难,Character AI仍然在用户中具有吸引力。
【AiBase提要:】
🤖 Character AI曾是00后最火爆的社交软件,但用户发现对话模型变得冷淡,失去趣味。
💔 用户流失严重,面临成本高、竞争激烈的挑战,甚至遭到挖角。
🔗 尽管困难重重,Character AI仍在用户中具有吸引力,希望未来能克服挑战,重回巅峰。
详情:https://www.chinaz.com/ainews/9957.shtml
美国经济学家「末日博士」:生成式 AI 将以我们未曾见过的方式释放生产力奇迹
尽管通常以悲观著称的,被称为「末日博士」的经济学家NourielRoubini指出,人工智能(AI)的进步将释放长期的生产力奇迹。站长网2023-06-17 08:34:250000LinkedIn 的报告显示最热衷于讨论 AI 的行业并非科技业
人们对人工智能的看法可能仍是褒贬不一,但关于这项技术的讨论肯定不会少,尤其是在雇主和求职者之间。根据LinkedIn最新发布的一份报告,在过去一年里,关于人工智能的对话增加了70%,这是该求职平台发布的第二份关于「工作场所中的人工智能」的报告。站长网2023-11-28 16:52:020000反套路的“新套路”?剧情达人借短剧翻红,广告接到手软
一句“真是服了你们这群颠公颠婆”,让“王妈”一跃成为短视频界的新顶流。王妈是谁?她是剧情达人“七颗猩猩”《重生之我在霸总短剧里当保姆》系列短剧中塑造的NPC之一,一个让被迫卷入霸总短剧言情桥段、还敢直面“颠公颠婆”,并精准吐槽、获得打工人狠狠共情的保姆角色。因“王妈”而爆火出圈后,“七颗猩猩”2个月涨粉近700万,广告接到手软,成为了短剧风口下吃到红利的代表性短视频达人。站长网2024-05-04 17:36:310000小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
对于2023年的计算机视觉领域来说,「分割一切」(SegmentAnythingModel)是备受关注的一项研究进展。Meta四月份发布的「分割一切模型(SAM)」效果,它能很好地自动分割图像中的所有内容站长网2023-12-07 14:08:480001多模态大模型MMICL霸榜 支持文本图像视频输入
要点:1、MMICL在多模态能力评测中表现突出,支持文本图像视频三种模态输入。2、采用两阶段训练,可实现“现学现卖”,有效缓解视觉语言模型中的语言偏见。3、已开源可商用的Flan版和仅科研用的Vicuna版,都发布在GitHub。最近,北京交通大学等机构联合推出了新多模态大模型MMICL。它支持文本、图像、视频三种模态的混合输入,在多项多模态能力评测中表现抢眼。站长网2023-09-19 16:41:080001