AI视野:Midjourney开始训练视频模型;文心一言用户破亿;优酷上线“AI搜片”功能;快手开源KwaiAgents系统
📰🤖📢AI新鲜事
Midjourney开始训练视频模型
Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新的风格调整器,为V7版本的重大更新做准备。
【AiBase提要:】
🚀 视频模型训练启动: Midjourney宣布即将开始视频模型训练,拓展其领先地位。
🆕 V6版本重大更新: 下周V6版本将推出,带来文本处理方面的显著进步,包括Inpainting功能和全新风格调整器。
🔮 V7版本预告: Midjourney透露V7版本将是一次重大更新,预示在视频生成领域竞争中的强劲实力。
文心一言用户破亿
百度首席技术官王海峰在WAVESUMMIT大会上宣布,文心一言用户数量突破1亿,与飞桨开发者规模达到千万。
【AiBase提要:】
🚀 文心一言用户已突破1亿,自8月31日开放服务以来,用户提问量与模型效果同步提升。
🛠️ 文心一言作为百度核心技术之一,在语义理解和自然语言处理领域取得显著成就。
💻 与文心一言技术深度绑定的百度飞桨开发平台成功发展,开发者规模已超过千万,达到1070万。
三星新推AI智能冰箱
三星推出2024Bespoke4-DoorFlexRefrigerator,内置摄像头识别食物,App提供个性化食谱建议,32英寸触摸屏支持TikTok和YouTube,强化AI功能。
【AiBase提要:】
🌿 内置摄像头辨识食物,App提供个性化食谱建议。
📲 与Galaxy手机镜像,32英寸触摸屏支持TikTok和YouTube。
🍽️ 强化的AI功能,如视觉AI识别食物并提供更多定制化选项。
阿里发布《AIGC治理与实践白皮书》
阿里巴巴携手中国电子技术标准化研究院发布《AIGC治理与实践白皮书》。阿里强调在AI发展中建立防火墙,同时突破AI应用的天花板,与社会共同解决问题,推动AI造福更广泛人群。
【AiBase提要:】
🔥 发展防火墙: 阿里致力于在AI领域筑牢发展的防火墙,确保安全发展。
🚀 突破天花板: 阿里强调不断突破AI应用的天花板,迎接前所未有的挑战。
🤝 社会共创: 阿里betway体育注册努力与社会各界合作,共同利用AI技术解决社会难题,推动AI造福更多人。
《纽约时报》起诉微软和OpenAI
纽约时报起诉微软和OpenAI,指责它们侵犯版权、滥用报纸知识产权,要求数十亿美元的法定和实际损害赔偿。
【AiBase提要:】
📰 侵权指控:微软和OpenAI被指控侵犯《纽约时报》版权,滥用报纸知识产权用于训练ChatGPT语言模型。
🤝 合作寻求解决方案:OpenAI表示对起诉感到失望,强调与媒体机构的对话,寻求互利合作方式,但未透露具体细节。
🔍 AI模型竞争与商业机会限制:纽约时报指责微软和OpenAI的GPT模型与其内容直接竞争,同时改变内容限制了时报的商业机会,引发媒体机构对人工智能模型的担忧。
比尔·盖茨预测人工智能将引发技术爆炸
比尔·盖茨预测人工智能将在未来18至24个月内迎来广泛应用,特别关注其在发展中国家的应用,强调全球卫生领域的平等性。
【AiBase提要:】
💡 盖茨预测人工智能将在未来18至24个月内广泛应用,加速科技领域的新发现。
🌍 盖茨关注人工智能在发展中国家的应用,特别强调在全球卫生领域的平等性。
🚀 盖茨指出人工智能在教育、抗击疾病等方面的多个应用案例,强调应根据各国实际情况进行调整。
🤖📈💻💡大模型动态
深言科技“语鲸大模型”通过备案
深言科技的“语鲸大模型”已通过备案,具备强大的语义理解与文本生成、代码理解等能力,将在文本创作、数学计算、代码补全等领域向社会公众开放服务。
【AiBase提要:】
🐋 技术实力: 深言科技的“语鲸大模型”在中文理解和生成方面领先,80亿参数的LingoWhale-8B模型已在多个评测基准上达到领先效果。
📅 产业合作: 入选“北京市通用人工智能产业创新伙伴计划”,并与清华大学NLP实验室合作,致力于推动人工智能产业创新。
🌐 开源与商用: LingoWhale-8B模型已开源供学术研究免费使用,商业用途需申请授权,展示深言科技在大模型领域的技术实力。
字节发布AI模型DiffPortrait3D
DiffPortrait3D是字节跳动团队开发的条件扩散模型,通过零样本能力,从一张肖像图生成逼真、多样的3D面部视图,支持不定姿态、夸张表情和各种艺术风格。
【AiBase提要:】
🌐 独特技术:DiffPortrait3D采用2D扩散模型生成先验,结合条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,实现多视角、野外场景下的高质量3D人像合成。
📸 零样本方法:通过零样本方法,DiffPortrait3D能够从单一肖像生成3D一致的新视图,支持不规定相机视角、极端面部表情和多样艺术描绘,无需繁琐微调。
🔬 综合优势:引入条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,确保在合成图像中保持面部特征一致性,经过多视角和野外基准测试展现出逼真高质量的3D面部重建。
🤖📱💼AI应用
优酷上线“AI搜片”功能
一项全新的AI功能“AI搜片”在优酷上线,被称为全网首个AI对话类影视搜索引擎。用户可通过多轮对话实现模糊搜索、影视问答等功能,提升搜索体验,使影视内容查找更智能和个性化。
【AiBase提要:】
🔍 优酷推出全新AI功能“AI搜片”——首个AI对话类影视搜索引擎。
🎙️ 用户通过对话实现模糊搜索、影视问答,无需具象问题即可完成搜索。
🌐 涵盖全网百万级影视剧实体信息,融合万亿条文娱相关知识词条,提升用户搜索体验。
👨💻💡🎯聚焦开发者
腾讯MotionCtrl正式开源
腾讯视频发布的MotionCtrl视频运动控制器正式开源,具有高度自定义相机和物体运动轨迹,实现精细多样化运动控制。
Demo:https://huggingface.co/spaces/TencentARC/MotionCtrl
项目地址:https://top.aibase.com/tool/motionctrl
【AiBase提要:】
🔄 MotionCtrl开源:腾讯视频发布的MotionCtrl视频运动控制器正式开源。
📹 多样化运动控制:项目可高度自定义相机和物体在3D空间的运动轨迹,实现更精细和多样化的运动控制。
🌐 架构优势:MotionCtrl独立控制摄像机和物体运动,考虑了它们的固有属性,提高了运动控制的灵活性。
快手开源KwaiAgents系统 性能超越GPT-3.5
快手与哈尔滨工业大学联合研发的「KwaiAgents」系统成功开源,通过Meta-Agent Tuning方法提升7B/13B模型性能,超越了GPT-3.5。
项目地址:https://github.com/KwaiKEG/KwaiAgents
【AiBase提要】
🚀 开源项目优势: 快手联合哈尔滨工业大学开源「KwaiAgents」系统,包含轻量级AI Agents系统、通用能力大模型、自动化评测Benchmark,为研究者提供便利。
🔄 Meta-Agent Tuning方法: 通过MAT方法,引入更多Agent Prompt模板,提升大模型在任务规划、工具使用、反思等能力,避免过拟合问题。
📈 性能超越GPT-3.5: 经过MAT调优后,7B-13B模型在各项能力上显著提升,评测结果显示超越了GPT-3.5效果。
字节推图像分割项目UniRef
UniRef 项目由字节公司推出,通过整合即参考图像分割、少镜头图像分割、参考视频对象分割和视频对象分割四种方式,利用UniFusion模块和SAM模型提高图像分割效率和精确度。
论文地址:https://arxiv.org/pdf/2312.15715.pdf
【AiBase提要】
🔍 UniRef 整合四种图像分割方式,实现自动选择最适合任务的分割方式。
🔄 UniFusion模块与SAM模型结合,进一步提高图像分割效率和精确度。
🚀 项目允许在广泛基准上进行联合训练,提高资源利用效率,实验结果显示在不同任务上取得先进性能。
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
【新智元导读】ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。ChatGPT早已成为世界耗能大户:一天用掉超50万度电,相当于1.7万个美国家庭的用电量!然而,大模型对能源的吞噬,远不仅如此。国际能源署(IEA)预测,从2022年到2026年,数据中心的用电量将翻一番。站长网2024-07-08 11:09:290000突破性AI方法WHAM:精确有效地预测视频中3D人体运动
**划重点:**1.🌐WHAM(World-groundedHumanswithAccurateMotion)方法成功结合3D人体运动和视频背景,实现精准的全球坐标下3D人体运动重建。2.💡该方法通过模型自由和基于模型的方法,利用深度学习技术,有效地从单眼视频中准确估计3D人体姿态和形状。站长网2023-12-15 16:21:470001小米捐赠2500万驰援北京河北暴雨救灾
近日,北京、河北多地出现极端降雨,引发洪涝和地质灾害,牵动着社会各界的心。今日,小米公益基金会宣布,捐赠2500万元驰援北京、河北暴雨救灾。用于保障北京、河北受灾群众的人身安全采购紧急救灾物资和救援设备,及帮助灾后重建工作。以下为小米公益基金会原文:近日,北京、河北多地出现极端降雨,引发洪涝和地质灾害,牵动着社会各界的心。站长网2023-08-02 09:23:310000网易云十年听歌报告发布!网易云音乐正式上线十周年
今年是网易云音乐上线的第十周年,为此今日网易云上线了「十年听歌报告」,用户可以在网易云音乐APP搜索「十年报告」查收。在报告中,网易云音乐会统计出用户2017年至2023年的每个年度最爱的音乐,以及每个季度最喜欢的音乐。同时还会生成一个名为「十年精选辑」的歌单。据悉,网易云音乐是一款由网易开发的音乐产品,该产品2013年4月23日正式发布。站长网2023-04-21 14:23:060001调查:近60%的组织正在营销中实施或探索生成式人工智能
##划重点:1.📈**市场调查结果:**调查显示近60%的组织正在实施或探索在营销中使用生成式人工智能(GenerativeAI),其中62%的营销人员相信生成式人工智能将增强人类创造力,提升直觉、情感和对上下文的理解。2.💰**预算和团队投入:**已投资生成式AI的组织将62%的预算用于此项技术,其中一半的组织已设定专门预算,47%分配了团队用于生成式AI在营销中的实施。0001