首页站长资讯AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

站长网2024-07-09 04:43:171阅

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、可灵AI又放大招：上线Web端，增加首尾帧控制、运镜控制等功能

可灵AI最近发布了重磅新功能，包括Web端上线、画质提升、首尾帧和镜头控制功能加入，文生视频时长延长至10秒。更新内容涵盖基础模型升级、首尾帧控制、镜头控制、文生视频时长增加、图生视频功能增强和Web端上线。可灵AI能生成高清视频，支持1080p分辨率，提供个性化视频控制选项，让用户创作更丰富多彩的内容。网页端服务免费上线，未来还将支持语音唇形同步等功能。

【AiBase提要:】

🚀 基础模型升级，支持1080p分辨率，画质达到电影级水准。

💡 首尾帧控制，用户可定制视频起始和结束画面，提升个性化创作体验。

🎥 镜头控制功能增加，包括横移、摇镜头等，让视频更生动有趣。

详情链接:https://top.aibase.com/tool/keling-ai

2、快手开源图像生成模型可图Kolors

快手今天放出了一项重磅消息，开源了自家的图像生成模型“可图 Kolors”，这一模型经过数十亿的文本图像对训练，搭载了通用语言模型（GLM）作为文本编码器，支持中英双语提示词，具有长文本处理能力和海量数据训练。可图 Kolors 还特别优化了中国文化元素，支持中文文字生成，展现出强大的技术支撑和文化传承。

【AiBase提要:】

🌟 中英双语支持: 采用通用语言模型（GLM）作为文本编码器，支持中英文提示词，能处理长达256个token的上下文。

🚀 长文本处理能力: 支持长达256个token的上下文长度，让创作者能够细致描绘心中所想，无论是复杂场景还是丰富故事。

💡 海量数据训练: 在数十亿个文本图像对上进行训练，模型拥有庞大的知识库，能够生成多样化且精准的图像。

可图入口:https://top.aibase.com/tool/kuaishouketudamoxingkolors

详细内容介绍：https://www.aibase.com/news/10085

3、快手推出AIGC微短剧《山海奇镜之劈波斩浪》

快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》，结合传统魅力与现代科技，为观众带来震撼的观看体验。通过大模型技术支持，呈现升级后的视觉效果，推动微短剧行业发展，引领“AIGC 微短剧”新潮流。

【AiBase提要:】

🎬 快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》

💡 微短剧以《山海经》为灵感来源，赛博风格复现上古神话世界中的神怪异兽和奇花异草

🌟 快手推出“星芒短剧×可灵大模型”创作者孵化计划，支持AIGC微短剧的创作

详细内容：https://www.aibase.com/news/10075

4、月之暗面推出 Kimi 浏览器插件支持点问笔、总结器等功能

Moonshot AI推出的Kimi浏览器插件为用户提供了点问笔和总结器两大功能，优化了用户在网页和应用中的体验。插件支持全局浮窗和侧边栏模式，方便用户在写作时进行持续对话和搜索。同时，Kimi还进行了体验优化，包括支持PDF文件打开、搜索引用溯源、内容复制等功能。双端同步更新还增加了计算器和问题推荐功能。

【AiBase提要:】

🖊️ 点问笔功能让用户通过划选文字获取即时解释和答疑

📝 总结器位于网页右下角，帮助用户快速总结全文内容

🔗 支持快捷键召唤Kimi，提供便捷操作和功能推荐

详情链接:https://kimi.moonshot.cn/extension/download

5、达摩院“寻光”炸场！可控编辑，轻松搞定AI视频工作流

AI视频创作领域迎来了一场革命性的变革，阿里达摩院推出的"寻光"平台在WAIC上震撼亮相，为创作者提供一站式AI视频创作解决方案，极大提高创作效率，重塑视频创作工作流。

【AiBase提要:】

✨ 一站式AI视频创作平台"寻光"推出，集剧本创作、分镜图设计、视频素材编辑于一体，简单高效

🔥 AI技术应用实现镜头角度调整、目标消除修改等一键完成，提升创作效率

💡 寻光平台支持剧本创作辅助、AI编辑功能、运镜控制、目标新增/消除/修改等多项强大功能

详情链接:https://top.aibase.com/tool/xunguangshipinchuangzuopingtai

6、书⽣·浦语2.5——InternLM2.5-7B模型宣布开源

2024年7月3日，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型InternLM2.5-7B。该模型在推理能力、长文本支持和自主规划与工具调用方面有显著提升。

【AiBase提要:】

🚀 InternLM2.5-7B模型在推理能力方面表现出色，特别在数学评测集MATH上实现了100%的性能提升，准确率达到60%。

💬 模型支持处理高达1M tokens的上下文，优化了长文档理解与智能体交互。

🔍 具备搜索和整合上百个网页信息的能力，通过MindSearch多智能体框架，有效整合网络信息。

详情链接:https://github.com/InternLM/InternLM

7、阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目，旨在提升人类与大型语言模型（LLMs）间的自然语音交互体验。该项目包括两个核心模型: SenseVoice和CosyVoice，分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景，如多语言翻译、情绪语音对话、互动播客和有声读物等。

【AiBase提要:】

🔊 CosyVoice专注于自然语音生成，支持多语言、音色和情感控制，表现出色。

🔍 SenseVoice致力于高精度多语言语音识别和情感辨识，支持超过50种语言。

🔗 FunAudioLLM项目结合SenseVoice、LLMs和CosyVoice，支持无缝的语音到语音翻译和情感语音聊天应用程序。

详情链接:https://github.com/FunAudioLLM

8、清华大学开源CodeGeeX4-ALL-9B：多语言代码生成模型超越主要竞争对手

清华大学知识工程组和数据挖掘团队推出的CodeGeeX4-ALL-9B标志着代码生成模型发展的里程碑，具有无与伦比的性能、全面的功能和用户友好的集成，将推动软件开发的效率和创新。

【AiBase提要:】

🚀 CodeGeeX4-ALL-9B是CodeGeeX系列的最新创新成果，代表了多语言代码生成的巅峰，设定了新的性能和效率标准。

💡 模型拥有9.4亿个参数，在其类别中是最强大的之一，表现出色且具备仓库级别的代码问答功能，提高开发人员与代码库交互效率。

🔗 CodeGeeX4-ALL-9B在性能基准测试中表现卓越，超越了更大的模型，确立了自己作为领先模型的地位。

详情链接:https://huggingface.co/THUDM/codegeex4-all-9b

9、反AI图像盗窃工具Glaze需求量剧增吸引大批艺术家

Glaze工具应运而生，旨在保护艺术家的风格不被AI图像生成器抄袭。随着Meta计划利用用户数据进行AI训练，Glaze需求量急剧上升。然而，安全研究人员发现了绕过Glaze保护的方法，引发了对其有效性的质疑。

【AiBase提要:】

🖼️ 艺术家追捧的Glaze工具用于防范AI图像盗窃。

🔒 Glaze需求激增，因Meta计划利用用户数据进行AI训练。

⚙️ 安全研究人员发现绕过Glaze保护的方法，对其有效性产生质疑。

详情链接:https://top.aibase.com/tool/glaze

10、科幻照进现实？Open-TeleVision支持远程操控机器人

这篇文章介绍了加州大学圣地亚哥分校和麻省理工学院研究员们开发的Open-TeleVision项目，该项目实现了远程操控机器人的高科技场景，让人仿佛置身于电影《阿凡达》中。系统支持多种设备，提供沉浸式体验，通过VR头显实现隔空操控，极大地提升了操作的便捷性和真实感。

【AiBase提要:】

🌟 开源远程操作系统，支持多设备轻松上手，实时立体视频流让操控更精准。

🤖 通过VR头显模拟人类视觉和颈部活动，实现沉浸式体验，告别传统2D视频平庸。

🔧 使用逆运动学算法和Web平台实现高效远程操作，解决人形机器人自由度匹配问题，数据采集训练机器人自主完成任务。

详情链接:https://github.com/Improbable-AI/VisionProTeleop

11、中国AI论文数量全球第一，清华成论文发表热门之地

中国在全球人工智能研究领域以惊人速度崛起，论文数量占全球总量25%，位居世界第一，展现出在AI科技人才素质和技术创新能力上的重大突破。学术机构如中国科学院和清华大学超越世界顶尖学府，企业如谷歌、微软、腾讯、阿里巴巴在AI研究领域贡献突出，彰显中国AI研究的多元化和活力。

【AiBase提要:】

🌟 中国AI论文数量全球领先，占全球总量的25%，位居世界第一。

🏫 学术机构表现卓越，中国科学院和清华大学在AI论文被引用次数上超越了世界顶尖学府。

📈 企业贡献显著，谷歌、微软、腾讯、阿里巴巴等企业在AI研究领域贡献突出，展现了中国AI研究的多元化和活力。

12、AI 模型训练成本暴涨，2027 年或达 1000 亿美元！

据Anthropic首席执行官表示，当前AI模型训练成本高达10亿美元，未来三年有可能上升到100亿美元甚至1000亿美元。这一预测引发了人们对AI泡沫是否即将破裂的担忧。硬件和能源消耗成为训练成本的主要驱动因素，随着AI模型的发展，这两方面的支出将急剧增加。人力资源、数据采集和运行维护等方面也将耗费大量成本，如果这些问题不得到解决，2027年的AI训练成本有可能达到1000亿美元。

【AiBase提要:】

⭐ 当前AI模型训练成本高达10亿美元，未来三年有可能上升到100亿美元甚至1000亿美元。

⭐ 硬件和能源消耗成为训练成本的主要驱动因素，随着AI模型的发展，这两方面的支出将急剧增加。

⭐ 人力资源、数据采集和运行维护等方面也将耗费大量成本，如果这些问题不得到解决，2027年的AI训练成本有可能达到1000亿美元。

AI日报快手上线可灵网页端并开源可图Kolors达摩院AI视频平台寻光炸场 月之暗面推Kimi浏览器插件

0001

评论列表

共(0)条

相关推荐

站长资讯
华为苹果发布会在同一天：将于9月10日发布划时代产品
华为今日宣布，其备受期待的品牌盛典及鸿蒙智行新品发布会将于9月10日举行，届时将展示华为的最新科技创新成果。华为消费者业务CEO余承东透露，此次发布会将推出华为最具前瞻性、创新性和颠覆性的产品，这些产品是业界梦寐以求但尚未实现的突破，华为通过五年的不懈努力，将科幻般的构想转化为现实。他强调，这将是华为的巅峰之作，值得市场和消费者的期待。
站长网2024-09-02 16:23:19
0000
站长资讯
比亚迪可口可乐强强联手！共同打造全新电动卡车
快科技9月29日消息，近日，比亚迪墨西哥分公司宣布与FEMSA及可口可乐FEMSA公司联合打造饮料行业电动物流卡车。FEMSA公司创立于1890年，总部位于墨西哥蒙特雷市，是一家拉丁美洲知名饮料公司，拥有全球知名可口可乐瓶装公司CocaColaFEMSA的47.9%股份主要帮助可口可乐生产各种饮料。
站长网2023-09-30 08:55:23
0000
站长资讯
大模型部署昂贵的原因：用最贵的模型处理最基本任务，犹如“让兰博基尼送披萨”
1.OpenAI计划推出新功能吸引开发者，称开发成本最高降至5%近日，路透社援引消息人士称，为了吸引更多企业和开发者更多地使用其技术，OpenAI计划下个月为旗下的AI产品推出重大更新，以便开发者们能够更便宜、更快速地构建基于其AI模型的软件应用程序。这些更新包括在其开发工具中添加内存存储。理论上，这可以将应用程序制造商的开发成本削减多达20倍，解决合作伙伴们对于价格的担忧。
站长网2023-10-15 10:01:58
0000
站长资讯
Gartner发布2024年十大战略技术趋势:包括全民化的生成式AI
日前，Gartner公布了2024年需要探索的10大战略技术趋势列表。Gartner杰出研究副总裁兼研究团队负责人ChrisHoward表示:“IT领导者和其他高管必须评估战略技术趋势的影响与益处，但由于技术创新的速度日益加快，这并非易事。例如生成式AI和其他类型的AI虽然带来了新的机遇并推动了若干趋势的发展，但要想通过长期使用AI获得业务价值，还需要采取严谨的方法广泛采用AI并注意风险。”
站长网2023-10-18 23:03:08
0000
站长资讯
郭明錤：苹果可能在 2024 年斥资 47.5 亿美元购买人工智能服务器
站长之家(ChinaZ.com)10月24日消息：据苹果分析师郭明錤预测，苹果预计将在2024年投入数十亿美元用于硬件以支持其人工智能（AI）的开发。郭明錤预计，苹果将在2023年至少投入6.2亿美元用于服务器，并在2024年投入47.5亿美元用于服务器。
站长网2023-10-24 23:32:39
0000