AI视野:Midjourney开始训练视频模型;文心一言用户破亿;优酷上线“AI搜片”功能;快手开源KwaiAgents系统
📰🤖📢AI新鲜事
Midjourney开始训练视频模型
Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新的风格调整器,为V7版本的重大更新做准备。
【AiBase提要:】
🚀 视频模型训练启动: Midjourney宣布即将开始视频模型训练,拓展其领先地位。
🆕 V6版本重大更新: 下周V6版本将推出,带来文本处理方面的显著进步,包括Inpainting功能和全新风格调整器。
🔮 V7版本预告: Midjourney透露V7版本将是一次重大更新,预示在视频生成领域竞争中的强劲实力。
文心一言用户破亿
百度首席技术官王海峰在WAVESUMMIT大会上宣布,文心一言用户数量突破1亿,与飞桨开发者规模达到千万。
【AiBase提要:】
🚀 文心一言用户已突破1亿,自8月31日开放服务以来,用户提问量与模型效果同步提升。
🛠️ 文心一言作为百度核心技术之一,在语义理解和自然语言处理领域取得显著成就。
💻 与文心一言技术深度绑定的百度飞桨开发平台成功发展,开发者规模已超过千万,达到1070万。
三星新推AI智能冰箱
三星推出2024Bespoke4-DoorFlexRefrigerator,内置摄像头识别食物,App提供个性化食谱建议,32英寸触摸屏支持TikTok和YouTube,强化AI功能。
【AiBase提要:】
🌿 内置摄像头辨识食物,App提供个性化食谱建议。
📲 与Galaxy手机镜像,32英寸触摸屏支持TikTok和YouTube。
🍽️ 强化的AI功能,如视觉AI识别食物并提供更多定制化选项。
阿里发布《AIGC治理与实践白皮书》
阿里巴巴携手中国电子技术标准化研究院发布《AIGC治理与实践白皮书》。阿里强调在AI发展中建立防火墙,同时突破AI应用的天花板,与社会共同解决问题,推动AI造福更广泛人群。
【AiBase提要:】
🔥 发展防火墙: 阿里致力于在AI领域筑牢发展的防火墙,确保安全发展。
🚀 突破天花板: 阿里强调不断突破AI应用的天花板,迎接前所未有的挑战。
🤝 社会共创: 阿里betway体育注册努力与社会各界合作,共同利用AI技术解决社会难题,推动AI造福更多人。
《纽约时报》起诉微软和OpenAI
纽约时报起诉微软和OpenAI,指责它们侵犯版权、滥用报纸知识产权,要求数十亿美元的法定和实际损害赔偿。
【AiBase提要:】
📰 侵权指控:微软和OpenAI被指控侵犯《纽约时报》版权,滥用报纸知识产权用于训练ChatGPT语言模型。
🤝 合作寻求解决方案:OpenAI表示对起诉感到失望,强调与媒体机构的对话,寻求互利合作方式,但未透露具体细节。
🔍 AI模型竞争与商业机会限制:纽约时报指责微软和OpenAI的GPT模型与其内容直接竞争,同时改变内容限制了时报的商业机会,引发媒体机构对人工智能模型的担忧。
比尔·盖茨预测人工智能将引发技术爆炸
比尔·盖茨预测人工智能将在未来18至24个月内迎来广泛应用,特别关注其在发展中国家的应用,强调全球卫生领域的平等性。
【AiBase提要:】
💡 盖茨预测人工智能将在未来18至24个月内广泛应用,加速科技领域的新发现。
🌍 盖茨关注人工智能在发展中国家的应用,特别强调在全球卫生领域的平等性。
🚀 盖茨指出人工智能在教育、抗击疾病等方面的多个应用案例,强调应根据各国实际情况进行调整。
🤖📈💻💡大模型动态
深言科技“语鲸大模型”通过备案
深言科技的“语鲸大模型”已通过备案,具备强大的语义理解与文本生成、代码理解等能力,将在文本创作、数学计算、代码补全等领域向社会公众开放服务。
【AiBase提要:】
🐋 技术实力: 深言科技的“语鲸大模型”在中文理解和生成方面领先,80亿参数的LingoWhale-8B模型已在多个评测基准上达到领先效果。
📅 产业合作: 入选“北京市通用人工智能产业创新伙伴计划”,并与清华大学NLP实验室合作,致力于推动人工智能产业创新。
🌐 开源与商用: LingoWhale-8B模型已开源供学术研究免费使用,商业用途需申请授权,展示深言科技在大模型领域的技术实力。
字节发布AI模型DiffPortrait3D
DiffPortrait3D是字节跳动团队开发的条件扩散模型,通过零样本能力,从一张肖像图生成逼真、多样的3D面部视图,支持不定姿态、夸张表情和各种艺术风格。
【AiBase提要:】
🌐 独特技术:DiffPortrait3D采用2D扩散模型生成先验,结合条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,实现多视角、野外场景下的高质量3D人像合成。
📸 零样本方法:通过零样本方法,DiffPortrait3D能够从单一肖像生成3D一致的新视图,支持不规定相机视角、极端面部表情和多样艺术描绘,无需繁琐微调。
🔬 综合优势:引入条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,确保在合成图像中保持面部特征一致性,经过多视角和野外基准测试展现出逼真高质量的3D面部重建。
🤖📱💼AI应用
优酷上线“AI搜片”功能
一项全新的AI功能“AI搜片”在优酷上线,被称为全网首个AI对话类影视搜索引擎。用户可通过多轮对话实现模糊搜索、影视问答等功能,提升搜索体验,使影视内容查找更智能和个性化。
【AiBase提要:】
🔍 优酷推出全新AI功能“AI搜片”——首个AI对话类影视搜索引擎。
🎙️ 用户通过对话实现模糊搜索、影视问答,无需具象问题即可完成搜索。
🌐 涵盖全网百万级影视剧实体信息,融合万亿条文娱相关知识词条,提升用户搜索体验。
👨💻💡🎯聚焦开发者
腾讯MotionCtrl正式开源
腾讯视频发布的MotionCtrl视频运动控制器正式开源,具有高度自定义相机和物体运动轨迹,实现精细多样化运动控制。
Demo:https://huggingface.co/spaces/TencentARC/MotionCtrl
项目地址:https://top.aibase.com/tool/motionctrl
【AiBase提要:】
🔄 MotionCtrl开源:腾讯视频发布的MotionCtrl视频运动控制器正式开源。
📹 多样化运动控制:项目可高度自定义相机和物体在3D空间的运动轨迹,实现更精细和多样化的运动控制。
🌐 架构优势:MotionCtrl独立控制摄像机和物体运动,考虑了它们的固有属性,提高了运动控制的灵活性。
快手开源KwaiAgents系统 性能超越GPT-3.5
快手与哈尔滨工业大学联合研发的「KwaiAgents」系统成功开源,通过Meta-Agent Tuning方法提升7B/13B模型性能,超越了GPT-3.5。
项目地址:https://github.com/KwaiKEG/KwaiAgents
【AiBase提要】
🚀 开源项目优势: 快手联合哈尔滨工业大学开源「KwaiAgents」系统,包含轻量级AI Agents系统、通用能力大模型、自动化评测Benchmark,为研究者提供便利。
🔄 Meta-Agent Tuning方法: 通过MAT方法,引入更多Agent Prompt模板,提升大模型在任务规划、工具使用、反思等能力,避免过拟合问题。
📈 性能超越GPT-3.5: 经过MAT调优后,7B-13B模型在各项能力上显著提升,评测结果显示超越了GPT-3.5效果。
字节推图像分割项目UniRef
UniRef 项目由字节公司推出,通过整合即参考图像分割、少镜头图像分割、参考视频对象分割和视频对象分割四种方式,利用UniFusion模块和SAM模型提高图像分割效率和精确度。
论文地址:https://arxiv.org/pdf/2312.15715.pdf
【AiBase提要】
🔍 UniRef 整合四种图像分割方式,实现自动选择最适合任务的分割方式。
🔄 UniFusion模块与SAM模型结合,进一步提高图像分割效率和精确度。
🚀 项目允许在广泛基准上进行联合训练,提高资源利用效率,实验结果显示在不同任务上取得先进性能。
超牛ComfyUI节点AnyNode来了!要啥功能让AI帮你编写
AnyNode是ComfyUI中一个令人印象深刻的新节点,它利用了大型语言模型(LLMs)的能力,允许用户通过输入提示词来创建具有特定功能的节点。以下是AnyNode节点的主要特点和使用方法:功能编写:AnyNode可以根据用户的要求编写Python函数,实现用户想要的任何功能。站长网2024-05-28 19:35:420000P图风波后李想首次发声:理想汽车将用光明反击黑暗
理想汽车旗舰车型理想MEGA今日启动交付,但自上市以来,该车在网络上遭遇诸多非议,甚至陷入离奇风波。理想汽车创始人李想,长久以来在微博上保持沉默,然而今日,他通过朋友圈发声,针对近期网络上的负面声音进行了正面回应。李想明确表示,近期网络上的风波,实际上是有组织的违法犯罪行为。他感谢众多用户和朋友的关心与支持,表示这些支持是他们成长的动力。对于存在的违法犯罪行为,理想汽车已经采取法律手段进行应对。站长网2024-03-11 10:55:300000B站京东再度深度合作京火计划双11期间正式上线
据报道,B站与京东在双11期间达成深度合作,共同推出了名为“京火计划”的数据生态共建项目。这也是继去年B站与淘宝推出“星火计划”后,B站与电商平台的数据合作再次升级。站长网2023-10-30 14:24:190000AI训练中的缺陷:算法决策或成为未来生活的威胁
要点:AI系统使用描述性标签训练的数据可能导致比人类更严厉的决定。设计AI模型的方式存在深刻缺陷,可能在未来影响决策的各个领域。研究发现,当人们对数据附加描述性标签时,与附加规范标签相比,AI系统的决策更为苛刻。站长网2023-11-28 16:04:060000爆火的生成式AI,能让智能音箱起死回生吗?
智能音箱这类如今几乎已经被大量消费者遗忘的产品,在此前经历了2017年、2018年的“疯狂”之后,早已不再是大多数消费者关注的对象。就在大家以为智能音箱会昙花一现时,ChatGPT的横空出世似乎让智能音箱有了焕发第二春的可能,也给了这个在走下坡路的行业一个新的机遇。那么,智能音箱与如今爆红的生成式AI能擦出火花吗?站长网2023-06-12 03:42:430000