AI日报:快手上线可灵网页端并开源可图Kolors;达摩院AI视频平台“寻光”炸场;月之暗面推Kimi浏览器插件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、可灵AI又放大招:上线Web端,增加首尾帧控制、运镜控制等功能
可灵AI最近发布了重磅新功能,包括Web端上线、画质提升、首尾帧和镜头控制功能加入,文生视频时长延长至10秒。更新内容涵盖基础模型升级、首尾帧控制、镜头控制、文生视频时长增加、图生视频功能增强和Web端上线。可灵AI能生成高清视频,支持1080p分辨率,提供个性化视频控制选项,让用户创作更丰富多彩的内容。网页端服务免费上线,未来还将支持语音唇形同步等功能。
【AiBase提要:】
🚀 基础模型升级,支持1080p分辨率,画质达到电影级水准。
💡 首尾帧控制,用户可定制视频起始和结束画面,提升个性化创作体验。
🎥 镜头控制功能增加,包括横移、摇镜头等,让视频更生动有趣。
详情链接:https://top.aibase.com/tool/keling-ai
2、快手开源图像生成模型可图Kolors
快手今天放出了一项重磅消息,开源了自家的图像生成模型“可图 Kolors”,这一模型经过数十亿的文本图像对训练,搭载了通用语言模型(GLM)作为文本编码器,支持中英双语提示词,具有长文本处理能力和海量数据训练。可图 Kolors 还特别优化了中国文化元素,支持中文文字生成,展现出强大的技术支撑和文化传承。
【AiBase提要:】
🌟 中英双语支持: 采用通用语言模型(GLM)作为文本编码器,支持中英文提示词,能处理长达256个token的上下文。
🚀 长文本处理能力: 支持长达256个token的上下文长度,让创作者能够细致描绘心中所想,无论是复杂场景还是丰富故事。
💡 海量数据训练: 在数十亿个文本图像对上进行训练,模型拥有庞大的知识库,能够生成多样化且精准的图像。
可图入口:https://top.aibase.com/tool/kuaishouketudamoxingkolors
详细内容介绍:https://www.aibase.com/news/10085
3、快手推出AIGC微短剧《山海奇镜之劈波斩浪》
快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》,结合传统魅力与现代科技,为观众带来震撼的观看体验。通过大模型技术支持,呈现升级后的视觉效果,推动微短剧行业发展,引领“AIGC 微短剧”新潮流。
【AiBase提要:】
🎬 快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》
💡 微短剧以《山海经》为灵感来源,赛博风格复现上古神话世界中的神怪异兽和奇花异草
🌟 快手推出“星芒短剧×可灵大模型”创作者孵化计划,支持AIGC微短剧的创作
详细内容:https://www.aibase.com/news/10075
4、月之暗面推出 Kimi 浏览器插件 支持点问笔、总结器等功能
Moonshot AI推出的Kimi浏览器插件为用户提供了点问笔和总结器两大功能,优化了用户在网页和应用中的体验。插件支持全局浮窗和侧边栏模式,方便用户在写作时进行持续对话和搜索。同时,Kimi还进行了体验优化,包括支持PDF文件打开、搜索引用溯源、内容复制等功能。双端同步更新还增加了计算器和问题推荐功能。
【AiBase提要:】
🖊️ 点问笔功能让用户通过划选文字获取即时解释和答疑
📝 总结器位于网页右下角,帮助用户快速总结全文内容
🔗 支持快捷键召唤Kimi,提供便捷操作和功能推荐
详情链接:https://kimi.moonshot.cn/extension/download
5、达摩院“寻光”炸场!可控编辑,轻松搞定AI视频工作流
AI视频创作领域迎来了一场革命性的变革,阿里达摩院推出的"寻光"平台在WAIC上震撼亮相,为创作者提供一站式AI视频创作解决方案,极大提高创作效率,重塑视频创作工作流。
【AiBase提要:】
✨ 一站式AI视频创作平台"寻光"推出,集剧本创作、分镜图设计、视频素材编辑于一体,简单高效
🔥 AI技术应用实现镜头角度调整、目标消除修改等一键完成,提升创作效率
💡 寻光平台支持剧本创作辅助、AI编辑功能、运镜控制、目标新增/消除/修改等多项强大功能
详情链接:https://top.aibase.com/tool/xunguangshipinchuangzuopingtai
6、书⽣·浦语2.5——InternLM2.5-7B模型宣布开源
2024年7月3日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型InternLM2.5-7B。该模型在推理能力、长文本支持和自主规划与工具调用方面有显著提升。
【AiBase提要:】
🚀 InternLM2.5-7B模型在推理能力方面表现出色,特别在数学评测集MATH上实现了100%的性能提升,准确率达到60%。
💬 模型支持处理高达1M tokens的上下文,优化了长文档理解与智能体交互。
🔍 具备搜索和整合上百个网页信息的能力,通过MindSearch多智能体框架,有效整合网络信息。
详情链接:https://github.com/InternLM/InternLM
7、阿里通义音频生成大模型 FunAudioLLM 开源 支持情绪语音对话、有声读物等场景
阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目,旨在提升人类与大型语言模型(LLMs)间的自然语音交互体验。该项目包括两个核心模型: SenseVoice和CosyVoice,分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景,如多语言翻译、情绪语音对话、互动播客和有声读物等。
【AiBase提要:】
🔊 CosyVoice专注于自然语音生成,支持多语言、音色和情感控制,表现出色。
🔍 SenseVoice致力于高精度多语言语音识别和情感辨识,支持超过50种语言。
🔗 FunAudioLLM项目结合SenseVoice、LLMs和CosyVoice,支持无缝的语音到语音翻译和情感语音聊天应用程序。
详情链接:https://github.com/FunAudioLLM
8、清华大学开源CodeGeeX4-ALL-9B:多语言代码生成模型 超越主要竞争对手
清华大学知识工程组和数据挖掘团队推出的CodeGeeX4-ALL-9B标志着代码生成模型发展的里程碑,具有无与伦比的性能、全面的功能和用户友好的集成,将推动软件开发的效率和创新。
【AiBase提要:】
🚀 CodeGeeX4-ALL-9B是CodeGeeX系列的最新创新成果,代表了多语言代码生成的巅峰,设定了新的性能和效率标准。
💡 模型拥有9.4亿个参数,在其类别中是最强大的之一,表现出色且具备仓库级别的代码问答功能,提高开发人员与代码库交互效率。
🔗 CodeGeeX4-ALL-9B在性能基准测试中表现卓越,超越了更大的模型,确立了自己作为领先模型的地位。
详情链接:https://huggingface.co/THUDM/codegeex4-all-9b
9、反AI图像盗窃工具Glaze需求量剧增 吸引大批艺术家
Glaze工具应运而生,旨在保护艺术家的风格不被AI图像生成器抄袭。随着Meta计划利用用户数据进行AI训练,Glaze需求量急剧上升。然而,安全研究人员发现了绕过Glaze保护的方法,引发了对其有效性的质疑。
【AiBase提要:】
🖼️ 艺术家追捧的Glaze工具用于防范AI图像盗窃。
🔒 Glaze需求激增,因Meta计划利用用户数据进行AI训练。
⚙️ 安全研究人员发现绕过Glaze保护的方法,对其有效性产生质疑。
详情链接:https://top.aibase.com/tool/glaze
10、科幻照进现实?Open-TeleVision支持远程操控机器人
这篇文章介绍了加州大学圣地亚哥分校和麻省理工学院研究员们开发的Open-TeleVision项目,该项目实现了远程操控机器人的高科技场景,让人仿佛置身于电影《阿凡达》中。系统支持多种设备,提供沉浸式体验,通过VR头显实现隔空操控,极大地提升了操作的便捷性和真实感。
【AiBase提要:】
🌟 开源远程操作系统,支持多设备轻松上手,实时立体视频流让操控更精准。
🤖 通过VR头显模拟人类视觉和颈部活动,实现沉浸式体验,告别传统2D视频平庸。
🔧 使用逆运动学算法和Web平台实现高效远程操作,解决人形机器人自由度匹配问题,数据采集训练机器人自主完成任务。
详情链接:https://github.com/Improbable-AI/VisionProTeleop
11、中国AI论文数量全球第一,清华成论文发表热门之地
中国在全球人工智能研究领域以惊人速度崛起,论文数量占全球总量25%,位居世界第一,展现出在AI科技人才素质和技术创新能力上的重大突破。学术机构如中国科学院和清华大学超越世界顶尖学府,企业如谷歌、微软、腾讯、阿里巴巴在AI研究领域贡献突出,彰显中国AI研究的多元化和活力。
【AiBase提要:】
🌟 中国AI论文数量全球领先,占全球总量的25%,位居世界第一。
🏫 学术机构表现卓越,中国科学院和清华大学在AI论文被引用次数上超越了世界顶尖学府。
📈 企业贡献显著,谷歌、微软、腾讯、阿里巴巴等企业在AI研究领域贡献突出,展现了中国AI研究的多元化和活力。
12、AI 模型训练成本暴涨,2027 年或达 1000 亿美元!
据Anthropic首席执行官表示,当前AI模型训练成本高达10亿美元,未来三年有可能上升到100亿美元甚至1000亿美元。这一预测引发了人们对AI泡沫是否即将破裂的担忧。硬件和能源消耗成为训练成本的主要驱动因素,随着AI模型的发展,这两方面的支出将急剧增加。人力资源、数据采集和运行维护等方面也将耗费大量成本,如果这些问题不得到解决,2027年的AI训练成本有可能达到1000亿美元。
【AiBase提要:】
⭐ 当前AI模型训练成本高达10亿美元,未来三年有可能上升到100亿美元甚至1000亿美元。
⭐ 硬件和能源消耗成为训练成本的主要驱动因素,随着AI模型的发展,这两方面的支出将急剧增加。
⭐ 人力资源、数据采集和运行维护等方面也将耗费大量成本,如果这些问题不得到解决,2027年的AI训练成本有可能达到1000亿美元。
微博正文及评论可以翻译了!微博新增内容翻译功能
微博宣布在正文和评论中增加翻译功能,以提升不同语言用户的使用体验。目前,该功能支持中文、英文、日语、韩语和泰语的翻译。具体使用规则如下:1、用户需使用网页端或微博APP版本13.7.2及以上。2、当微博文本内容与浏览器或手机设置的语言不一致时,用户可以选择将正文或评论内容翻译为浏览器或手机设置的语言。站长网2023-07-26 16:02:48000010秒钟复刻AI付航吐槽一切,这就是现在最好的TTS声音克隆。
上周末,我追了两个月的脱口秀,终于总决赛了。周六我一边看LOLS14总决赛,一边看《喜剧之王单口季》,真就体会了一把什么叫心态过山车。。。拉的很拉,稳的很稳。好在脱口秀这边,我一直很喜欢的演员付航,不负众望地拿到了总冠军。决赛这场他还是“Passion”到极点,劲儿给得太足了。这场的段子和表演都太NB。给我看的笑中带泪,真的。0001何小鹏:小鹏MONA M03即将开启大规模交付
今天上午,小鹏汽车的创始人、董事长兼CEO何小鹏宣布了一个令人振奋的消息:小鹏汽车的最新车型MONAM03即将开始大规模交付。为了庆祝这一里程碑,官方发布了大量宣传视频,展示了新车下线的壮观场景以及开始发运的激动人心的时刻。站长网2024-08-31 16:49:340000英伟达最新AI AgentEureka开源 可完成转笔等复杂动作
要点:英伟达的最新AIAgentEureka使用GPT-4生成奖励函数,教会机器人完成多项复杂任务,包括转笔、打开抽屉、抛球等,表现超越人类专家。Eureka采用混合梯度架构,结合无梯度的情境学习和强化学习,通过上下文来实现人类水平的奖励算法设计,大幅提升机器人性能。这项研究受到广泛关注,开源项目可在机器人领域应用,尤其在处理复杂任务和高维电机控制方面表现出色,甚至有时与人类策略负相关。站长网2023-10-21 14:47:030000iPhone 15系列机模曝光 Pro版独享固态静音键
据数码博主@来回五三七最近曝光的机模显示,iPhone15系列将继续推出四种机型,包括iPhone15、iPhone15Plus、iPhone15Pro和iPhone15ProMax。这些机型在外观上与当前的iPhone14系列相似,但是有一些重要的区别。站长网2023-07-18 12:30:530000