每日AI:Pika推出Lip Sync功能;阿里推对口型视频生成工具EMO;DomoAI推fusion style功能;GitHub上线Copilot Enterprise通用版本
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
Pika推出Lip Sync功能 支持视频人物嘴部动画和音频同步
【AiBase提要:】
⭐️ Lip Sync功能帮助用户实现嘴部动画和音频同步
⭐️ Pika Pro用户可体验,订阅费每月58美元
⭐️ 用户可选择输入文字生成音频或上传自己音频
产品入口:https://top.aibase.com/tool/pika
阿里推声画同步框架EMO 1张图片加音频就可以做会说话的头像视频
【AiBase提要:】
⭐ 只需输入图片和音频即可生成具有表现力的视频
⭐ 多语言、对话、唱歌以及快速语速的适配
⭐ 重要意义,为多语言、多样化场景下的角色表现提供新可能性
项目地址:https://top.aibase.com/tool/emo
特斯拉手机应用上线AI聊天助手“特斯拉助手Beta版”
【AiBase提要:】
⭐ 特斯拉手机应用推出AI聊天助手“特斯拉助手Beta版”提供全新交互体验
⭐ 特斯拉助手Beta版回答用户关于特斯拉产品的问题,提升用户了解和使用体验
⭐ 马斯克对AI技术兴趣浓厚,特斯拉AI助手创新举措将推动AI技术在汽车行业应用
DomoAI推出全新fusion style功能 简单提示词可替换风格还可以一键换衣
【AiBase提要:】
⭐ 用户通过简单提示词改变视频风格
⭐ 视频中人物可替换小物品、换新衣服
⭐ 设定视频时长,3秒、5秒、10秒选择
产品入口:https://top.aibase.com/tool/domoai
GitHub上线Copilot Enterprise通用版本
【AiBase提要:】
🚀 基于GPT-4的代码编写工具
🔍 开发人员可通过文本提示获取、审核、扩展代码
💼 每月39美元,包含所有商业计划功能,支持大型团队
项目地址:https://top.aibase.com/tool/github-copilot-enterprise
Playground发布最新文生图模型v2.5 提升人像细节
【AiBase提要:】
⭐ 高美感图像生成,提升视觉效果和美学质量。
⭐ 改进多纵横比图像生成,灵活处理各种尺寸图像。
⭐ 人物中心细节提升,采用新对齐策略减少视觉错误。
产品入口:https://top.aibase.com/tool/playground-ai
模型:https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic
Salesforce宣布公开测试AI助手Einstein Copilot
【AiBase提要:】
⭐️ Einstein Copilot是面向CRM的新型定制化、对话式、生成式AI助手
⭐️ 目前支持Sales Cloud和Service Cloud,其他云将在 2024 年后提供
⭐️ 客户可以使用私有数据生成响应,实现AI CRM加速增长和提高生产力
入口:https://top.aibase.com/tool/einstein-copilot
Toona:一款好用的黑白漫画上色工具
【AiBase提要:】
⭐ 可以批量给黑白漫画上色,提供“清除”和“添加颜色提示”的选项
⭐ 提供多种色彩选择,上色效果非常不错
⭐ 重绘速度较快,免费提供使用
产品入口:https://top.aibase.com/tool/toona
📰🤖📢AI新鲜事
谷歌豪掷 6000 万美元购买Reddit 数据 用来训练AI模型
【AiBase提要:】
🔍 谷歌将使用Reddit数据训练AI模型,加速AI发展步伐。
🔍 Reddit作为资源丰富社交平台,为AI提供宝贵数据。
🔍 Reddit联合创始人是第三大股东,引发讨论。
超能干!OpenAI的AI代理相当于 700 名客服的工作量
【AiBase提要:】
🚀 Klarna宣布,AI助手在一个月内处理了三分之二的客服聊天,相当于 700 名员工的工作。
📈 AI在此期间处理了 230 万次对话,客户满意度高,错误率下降25%。
💼 该AI在 23 个市场提供服务,全天候可用,支持 35 种语言,计划增加更多功能。
Midjourney可能在这个选举季禁止生成拜登和特朗普的图片
【AiBase提要:】
🚫 举措旨在避免选举季引发争议和纷争。
📵 禁止这些图片可能影响政治讨论和观点交流。
🤝 中途之旅寻找平衡言论自由和平台秩序的解决方案。
魔搭社区开源多智能体框架AgentScope
【AiBase提要:】
⭐️ AgentScope支持纯Python编程,提供灵活的应用流程编排和丰富的API服务,简化开发流程。
⭐️ AgentScope提供全面的重试机制、容错控制和异常处理,确保应用稳定高效运行。
⭐️ AgentScope提供系统性支持多模态数据的交互,设计了新的基于Actor的分布式机制,可用于游戏制作和视频生成。
项目地址:https://github.com/modelscope/agentscope
开源小型语言模型MobiLlama 手机可运行训练
【AiBase提要:】
📱 MobiLlama是为资源受限设备设计的小型语言模型。
🌐该模型旨在提供准确、轻量级的解决方案,适应设备上的处理需求和能效。
🔒 MobiLlama为移动设备提供精确且透明的选择,适用于资源有限的环境。
斯坦福大学研究人员发布新机器学习方法C3PO:根据上下文定制大型语言模型
【AiBase提要:】
⭐ C3PO 方法通过情境化批评策略微调语言模型,避免过度泛化,确保稳健性。
⭐ 采用直接偏好优化和监督微调损失来调整模型,保持性能。
⭐ 该方法为个性化和高效的人工智能工具铺平道路,增强实用性和可访问性。
项目入口:https://top.aibase.com/tool/c3po
论文入口:https://arxiv.org/abs/2402.10893
ChatMusician:一个融合了音乐天赋的开源大语言模型
【AiBase提要:】
⭐️ 利用ABC记谱法实现文本兼容的音乐符号系统
⭐️ 模型能够独立使用纯文本处理音乐,无需多模态神经网络
⭐️ ChatMusician将音乐与语言有机结合,展示了大语言模型在音乐领域的潜力
项目地址:https://top.aibase.com/tool/chatmusician
论文地址:https://arxiv.org/pdf/2402.16153.pdf
OpenDiT:一个用来加速类似Sora的DiT架构模型训练和推理项目
【AiBase提要:】
⭐ 优化内核、混合并行方法和 FastSeq 技术提高 GPU 计算速度和降低内存占用
⭐ 简单易用的接口,用户无需了解分布式训练实现细节,轻松进行文本到图像和文本到视频的生成
⭐ 核心技术包括优化内核、混合并行方法和 FastSeq,提高训练和推断效率,适用于不同场景
项目地址:https://top.aibase.com/tool/opendit
华为高阶智驾ADS 2.0首车 余承东:问界新M5开启预订
快科技4月17日消息,华为车BU董事长余承东官宣,问界新M5现已开启预订。余承东表示:一年前的今天,我们发布了鸿蒙智行首款搭载华为高阶智能驾驶ADS2.0的车型问界M5智驾版。自此,我们正式开启了高阶智驾新赛道。站长网2024-04-18 16:17:000000iPhone 16 Pro Max可能将配备超长焦摄像头
据macrumors消息,iPhone16ProMax可能是第一款采用超长焦潜望镜相机的iPhone手机,这种相机可以大幅提高光学变焦倍数,这是来自亚洲的一份新报告透露的。站长网2023-07-19 11:02:460000华人团队颠覆CV!SEEM模型可一键分割图像和视频
继Meta的「分割一切」之后,又一个颠覆CV的模型来了!近日,威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。论文地址:https://arxiv.org/pdf/2304.06718.pdfSEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。站长网2023-04-23 18:08:290000蓝厂最强直屏旗舰!vivo X100s发布:3999元起
快科技5月13日消息,今晚,vivoX100s正式登场,这是vivo最强悍的直屏旗舰。售价方面,12GB256GB售价3999元,16GB256GB售价4399元,16GB512GB售价4699元,16GB1TB售价5199元。站长网2024-05-13 21:46:060000比特币价格飙升至近一年新高:近3.8万美元,但远未达到2021年最高水平
**划重点:**1.🚀最新数据显示比特币价格接近38,000美元,为近一年最高,过去一个月涨幅超过38%。2.📈增长原因可能包括联邦利率放缓,FTX创始人SamBankman-Fried的定罪,以及美国证券交易委员会批准比特币交易所交易基金(ETF)。站长网2023-11-16 11:06:470000