AI日报:ChatGPT推全能型版本ChatGPT Edu;快手上线文生图产品可图;阿里宝藏项目被Novita AI开源了;Midjourney将发布V6.5版本
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、ChatGPT Edu版本来啦:支持GPT-4o、自定义GPT、数据分析
ChatGPT Edu版本推出,为大学校园提供多功能ChatGPT,助力学生、老师提升学习质量和教学效率。多所顶尖大学已在教育中应用ChatGPT,18-24岁年轻人是主要用户群。功能包括GPT-4o支持、数据分析、自定义GPT等,提供更高消息限制和语音支持。安全机制完善,实际应用案例丰富。
【AiBase提要:】
🚀 ChatGPT Edu版本推出,支持GPT-4o、自定义GPT、数据分析,助力学生、老师提升学习效率。
🔍 多所顶尖大学已在教育中使用ChatGPT,18-24岁年轻人是主要用户群,具有强大的学习需求和接受能力。
💡 实际应用案例丰富,包括期末反思作业、社区服务、语言训练等,教育领域深度应用ChatGPT。
2、快手上线自研文生图大模型产品“可图”
快手自研的文生图大模型“可图”正式对外开放,为用户带来全新的AI图像创作体验。这款大模型支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。用户可以通过“可图”微信小程序或网页版轻松体验前沿技术。
【AiBase提要:】
🔍 “可图”大模型参数规模达十亿级,数据来源包括开源社区、快手内部构建和自研AI技术的融合。
🎨 “可图”覆盖常见千万级中文实体概念,提供更广泛、更深入的图像创作支持。
🧠 “可图”引入强化学习和奖励模型技术,解决文生图大模型处理长文本和复杂语义文本输入效果不佳的问题。
产品入口:https://top.aibase.com/tool/kuaishouketudamoxingkolors
3、百度网盘推出漫画头像AI生成功能
百度网盘推出了一项令人惊叹的AI新功能,在儿童节前夕,用户只需一张照片就能变身为童年动漫中的主角。这项功能极具个性化,让用户仿佛置身于精彩的动画世界,快速高效的处理速度也让体验更加流畅。
【AiBase提要:】
🎨 个性化转化:用户上传照片即可变身为动漫人物,体验独特风格。
🚀 快速处理:百度网盘AI功能处理速度极快,短短几秒钟即可生成精美动漫照片。
🌟 多样化效果:不仅可转化为动漫形象,还能模拟经典动画效果,满足不同用户需求。
4、Claude 3 开放第三方 API,实现业务流程自动化
Anthropic 的新功能使得用户可以更便捷地与 Claude 互动,并通过结构化 API 调用实现各种任务的自动化执行。同时,Claude 也能够处理图像并融合到实时应用中,为企业提供更智能、高效的解决方案。
【AiBase提要:】
🔍 用户通过文本提问让 Claude 自动执行多种任务
🔍 用户可以通过结构化 API 调用实现常规操作和问题回答
🔍 Anthropic 的新功能使 Claude 能处理图像和实时应用
5、Novita AI开源Animate Anyone项目 上传一张照片即可合成动画
Novita AI开源了Animate Anyone项目,用户只需上传一张照片即可合成动画。这一技术为动画制作带来了新的可能性和机遇,让用户能够快速创建令人惊艳的作品。
【AiBase提要:】
👉 ViViD可以自然地将服装移到视频人物身上
👉 无论是裙子还是裤子都可以随意替换,适应多种服装试穿需求
👉 目前官方只发布了演示和论文,暂未公布代码
项目页:https://top.aibase.com/tool/vivid
论文地址:https://arxiv.org/pdf/2405.11794
6、阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣
阿里巴巴与中国科学技术大学联手推出的ViViD框架革新了虚拟试衣体验,实现了视频中人物衣物的实时替换,解决了时间一致性和图像质量难题,提升了试衣效果。
【AiBase提要:】
👗 先进技术:ViViD基于扩散模型技术,实现视频中衣物实时替换,生成自然逼真效果。
🔧 三大核心组件:服装编码器、姿势编码器、时间模块协同工作,提取衣物细节、编码姿势、保持时间连贯性。
🌟 创新特征融合:引入注意力特征融合机制优化衣物语义信息整合,提升试衣效果贴合用户需求。
详情链接:https://top.aibase.com/tool/vivid
7、Perplexity 推出了Page 创建功能 快速生成专业文档
Perplexity AI推出了最新功能Perplexity Pages,旨在帮助用户快速生成专业级别的文档,提升内容创作者生产力,挑战传统知识库平台。工具快速生成内容,支持高度定制,媒体内容插入,信息验证与来源管理,共享与搜索优化。
【AiBase提要:】
🚀 快速生成专业文档,节省时间精力。
🔧 高度定制化,满足不同需求。
📸 媒体内容插入提升文档吸引力。
详情链接:https://top.aibase.com/tool/perplexity
8、Midjourney将发布V6.5版本 很快网页版将面向所有人开放
Midjourney即将发布V6.5版本,将带来图像质量的大幅提升,网页版也将迎来重大更新。尽管在视频模型开发上遇到挑战,但团队坚信持续努力将取得更大突破。
【AiBase提要:】
🚀 图像质量大幅提升,可能与V7版本一致,连贯性、皮肤、手和身体表现将改善。
💻 网页版将摆脱Discord依赖,提供更好的用户体验。
💡 推出风格空间探索器和更新探索页面,考虑提供订阅折扣吸引更多用户。
9、Suno3.5版本模型已向所有人开放 可制作4分钟歌曲
Suno最新的3.5版本模型开放给所有用户使用,带来了制作4分钟歌曲、2分钟歌曲扩展和改进的歌曲结构等功能。Suno还推出了新功能,可以将任何声音转化为音乐,为音乐创作带来新可能性。公司融资1.25亿美元,巩固了在AI音乐领域的领先地位。Suno展示了强大的创新能力和领先地位。
【AiBase提要:】
🎵 制作4分钟歌曲和2分钟歌曲扩展
🎶 将任何声音转化为音乐,创作新可能性
💰 公司融资1.25亿美元,巩固领先地位
详情链接:https://top.aibase.com/tool/suno-ai
10、You.com推自定义助手功能
You.com推出自定义助手功能,让用户利用顶级语言模型如GPT-4o、Llama3和Claude3创建个性化AI助手,旨在提高用户在复杂工作任务中的生产力。该功能使强大的语言模型更易于访问并适应个人需求,为用户提供定制化的AI助手体验。
【AiBase提要:】
⭐️ 定制AI助手旨在提高用户在复杂工作任务中的生产力
⭐️ You.com致力于提供准确性和实时信息,通过在线访问提供更相关可靠的响应
⭐️ 技术的影响深远,定制AI助手有潜力改变医疗、金融和教育等领域的知识工作
11、Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia发布的Sonic低延迟语音生成模型引起广泛关注,其快速推理速度和超低延迟让人印象深刻。Sonic能够实时生成具有逼真情感和表达能力的语音,用户只需提供10秒录音即可模仿说话者的声音特征。Cartesia的目标是打造实时智能系统,他们引入了创新的SSM架构,取得了初步进展。
【AiBase提要:】
🚀 Sonic模型延迟仅为135毫秒,适合聊天应用。
😊 Sonic展现人类情感和表达能力,使对话更加自然。
🔧 用户可调节音调、速度、情感等参数,定制化语音输出。
详情链接:https://top.aibase.com/tool/carteisa-sonic
12、Gartner 预测2024年人工智能芯片收入将达到712亿美元
根据Gartner的预测,到2024年全球人工智能半导体的收入将增长33%,达到712亿美元。这一趋势将推动电脑普遍具备人工智能功能,企业电脑购买也将完全转向人工智能电脑。AI处理将主要在数据中心进行,加速器的价值预计将达到210亿美元。
【AiBase提要:】
📈 预计2024年全球人工智能半导体的收入将增长33%,达到712亿美元
💻 预计2024年有22%的电脑将具备人工智能功能,到2026年底,企业电脑购买将完全转向人工智能电脑
🏭 AI处理将主要在数据中心进行,2024年服务器中使用的AI加速器的价值将达到210亿美元
13、谷歌被秒杀!高保真3D头像逼真到恐怖 小姐姐挤眼,挑眉毫无破绽
最近德国慕尼黑工业大学和伦敦大学学院等研究团队提出的NPGA算法引起广泛关注,能生成高保真3D头像,逼真表情令人难以分辨真假。技术创新点在于采用高斯点云生成3D人像形状,引入神经参数化头部模型捕捉细微表情变化,提高真实感。
【AiBase提要:】
⭐ 高保真3D头像: NPGA生成逼真的3D头像,表情丰富,接近真实人类。
⚙️ 创新技术: 使用高斯点云构建3D人像形状,提高渲染效率和逼真度。
😲 神经网络模型: 利用神经参数化头模型捕捉人脸细微表情变化,模拟真实人类表情。
详情链接:https://tobias-kirschstein.github.io/nersemble/
谷歌2024年目标:成为全球最先进、安全、负责任的AI提供商
划重点:🤖Google2024年的主要目标是“提供全球最先进、安全、负责任的人工智能”。🚀其他目标包括提升知识、学习、创造力和生产力,创建有用的个人计算平台和设备,推动企业和开发者在GoogleCloud中创新,交付全球最受信任的产品和平台,以及构建一个“卓越”的Google。🌐在云计算业务方面,由于AI能力的不足,可能面临更多的裁员压力。站长网2024-01-22 11:15:520000创新免费AI视频创作工具Show-1,仅占普通模型25%GPU内存
文章概要:1.新加坡国立大学研究团队成功研发出名为Show-1的AI系统,能够从文本描述中生成高质量视频。2.Show-1采用像素和潜变模型的混合架构,充分利用了两种方法的优势,实现了文本到视频的精确对齐和高效放大。3.与纯像素模型相比,Show-1仅需使用20-25%的GPU内存,同时在逼真度和文本到视频对齐方面实现了相同或更好的结果。站长网2023-10-07 10:49:170001雷军年度演讲:小米坚持高端路线,视为生死之战!
8月14日晚上7点,小米创始人雷军在北京国家会议中心举行了2023年度演讲。今年的演讲主题是“成长”,雷军分享了他过去30多年来的关键成长经历和感悟。雷军回顾了他大学时期的经历,从如何选择课程到如何自学编程,他以自己的经历告诉大家,找到懂的人请教是解决问题的关键。0000史诗级更新!小米14 Ultra推送最新澎湃OS:应用启动更快、相机增强
快科技7月5日消息,根据用户反馈,目前小米已向小米14Ultra用户全量推送澎湃OS1.0.15.0.UNACNXM正式版更新,更新包大小263MB左右。该版本对系统、笔记、控制中心、小部件、锁屏、时钟、计算器、相机、相册、文件管理器、手机管家、状态栏、通知栏多方面进行优化与修复,算得上是一次重磅更新了。站长网2024-07-05 16:26:3000005分半钟 得到一杯机器人“手冲”咖啡
国际在线报道(记者位树理、马嘉欣):在第七届世界智能大会智能科技展上,中国移动研发的“AI咖大师”手冲咖啡机器人吸引了众多观展者的目光。据现场工作人员介绍,这台手冲咖啡机器人根据世界咖啡师大赛冠军的手冲标准设计定义工作流程,从取豆、磨豆、闷蒸再到最后的器具清洗,五分半钟左右就可以制作出一杯香浓的手冲咖啡。0001