AI视野:Stable Diffusion3发布;剪映海外版CapCut推文生视频;微软win10、win11照片应用增加AI橡皮擦功能;OpenAI更新GPT商店
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/

🤖📱💼AI应用
Stable Diffusion3发布 文字渲染能力超强,图像生成质量超越Midjourney

【AiBase提要:】
⭐️ Stable Diffusion3发布,具有强大的文字渲染、多主题提示和图像质量能力。
⭐️ 技术方面结合了扩散型transformer架构和flow matching技术。
⭐️ 公测开放的Stable Video提供文生视频和图生视频功能。
排队地址:https://top.aibase.com/tool/stable-diffusion-3
剪映海外版CapCut推文生视频功能 每人每天可免费生成5个视频
【AiBase提要:】
⭐ 支持AI自动转换文字描述为视频
⭐ 多镜头组合剪辑,生成丰富视频效果
⭐ 每人每天免费生成5个视频,适用人群广泛
官方入口:https://top.aibase.com/tool/capcutwenshengshipin
微软Windows10和 Windows11的照片应用增加AI橡皮擦功能

【AiBase提要:】
⚙️ Generative Erase功能类似魔术橡皮擦,为照片编辑带来全新体验。
📷 用户可轻松进行图像中的AI移除操作,提高编辑便捷性和效果。
💡 微软通过Generative Erase持续创新图像处理,提供更丰富编辑工具和体验。
创新性3D数据合成模型,微软推出EgoGen
【AiBase提要:】
⭐ EgoGen能够适用于多个自我中心感知任务,使用创新的人体运动合成模型来合成高质量数据。
⭐ 通过双阶段强化学习方案,EgoGen无缝结合自我感知视觉线索和身体运动,实现更加自然的运动。
⭐ EgoGen在人称感知任务上取得了显著成果,提升了现有算法在头戴式摄像头建图和定位等任务中的性能。
论文地址:https://arxiv.org/abs/2401.08739
即将开源地址:https://github.com/ligengen/EgoGen
智源研究院推出新一代多模态小模型Bunny-3B
【AiBase提要:】
⭐ 通过数据浓缩技术获得高质量训练数据
⭐ 将LAION-2B压缩成2M核心集
⭐ Bunny-3B小模型在多模态任务上表现优异
项目地址:https://github.com/BAAI-DCAI/Bunny
强大代码解释器OpenCodeInterpreter 可运行生成的代码

【AiBase提要:】
⭐️ 自动创建代码段,完成编程任务
⭐️ 运行生成的代码验证预期工作
⭐️ 根据执行结果和反馈生成更优质代码
项目地址:https://top.aibase.com/tool/opencodeinterpreter
模型:
https://huggingface.co/collections/m-a-p/opencodeinterpreter-65d312f6f88da990a64da456
📰🤖📢AI新鲜事
OpenAI更新GPT商店,增加用户评分和扩展构建者资料

【AiBase提要:】
⭐ 用户现在可以为第三方GPT进行评分
🤖 GPT构建者的个人资料更丰富,包括链接和评分信息
🔄 OpenAI未实现根据GPT使用频率分享收益的计划
Midjourney计划在6个月内开放API 视频功能会推迟到V7模型
【AiBase提要:】
⭐ Midjourney计划在未来六个月内开放API
⭐ V7模型将生成视频,产品即将在中国推出
⭐ Midjourney的发展前景看好,值得期待
Reddit通过与AI公司合作的数据授权收入达2.03亿美元
【AiBase提要:】
🤖 Reddit强调与AI供应商的关系,特别是与OpenAI等公司的合作对上市前景产生积极影响。
🌐 Reddit数据对AI模型培训的重要性,以及AI公司通过授权协议获取数据的焦点。
📈 Reddit通过数据授权实现巨额收入,凸显数据在AI领域的关键作用。
Chrome 获得由 Gemini 提供支持的内置 AI 写作工具
【AiBase提要:】
⭐ Chrome浏览器推出新的AI写作生成器
⭐ Gemini驱动,可帮助写各种文本内容
⭐ 实验阶段,仅在Windows、Mac、Linux提供英文版本
全新图文生成方式MiniGPT-5 生成文本的同时创作匹配的图片
MiniGPT-5是一款基于大型语言模型的视觉与语言生成工具,旨在实现图像和文本的协同生成。它采用了创新的"生成vokens"概念,作为实现图像和文本协同生成的桥梁。MiniGPT-5通过独特的两阶段训练策略,专注于无需详细图像描述的多模态生成,从而提高模型的鲁棒性。该工具在多个基准数据集上表现出色,是一个多模态生成的有力工具。站长网2023-10-08 10:44:030000魅族21系列推出Flyme 10.5系统:语音助手接入AI大模型
魅族21系列最新推出了Flyme10.5.0.1A稳定版系统,此次更新的语音助手接入了AI大模型,用户可以在使用魅族21系列手机时进行体验。以下是本次系统更新的主要内容:1.语音助手小溪接入了AI大模型,支持自然语言对话、文档总结、知识问答、出行规划、运动健康建议、文案生成等AI功能。0000生态、用户、AI,理解广告营销未来的三个关键
在当下的商业环境中,广告主面临着前所未有的挑战。首先是过去简单粗暴的营销玩法显得力不从心。那些只追求快速转化、依赖大量购买流量的策略,停投即停效;而且当所有广告主都默认选择这一玩法时,买量成本随之上涨,而流量的转化率却很可能呈下降趋势。0001抖音“八零徐姥姥”周涨粉近百万,银发流量,顺势而为
前阵子看到一个短视频,老人颤颤巍巍地用手剥着一粒粒瓜子,2岁的重孙一粒粒地吃着,一老一小,岁月静好,哪怕是别人的故事,也让看的人觉得温暖和感动。近年来,老人越来越多地出现在互联网上,他们或许不懂互联网,但却成为短视频中受欢迎的主角群体之一,经年沧桑下叠加出来的美,丝毫不逊于美颜滤镜叠加下的俊男靓女。这不,“八零徐姥姥”就是这样一位老人,根据数据显示,其在近期周涨粉约77万,位列抖音涨粉榜前茅。站长网2023-09-25 13:50:590001安永报告:AI 引发专业人士对网络安全的担忧
网络安全威胁一直是专业人士最关心的问题,但一份新报告表明,最近的技术进步使这种担忧达到了新的高度。周一,安永公布了2024年网络安全人类风险调查结果,该调查收集了公共和私营部门1,000名美国雇员关于网络安全意识和实践的见解。图源备注:图片由AI生成,图片授权服务商Midjourney0000