央视联合上海人工智能实验室发布央视听媒体大模型CMG Media GPT
站长网2023-07-24 12:04:421阅
7月20日,上海人工智能实验室(上海AI实验室)、中央广播电视总台联合发布“央视听媒体大模型”(CMG Media GPT)。
目前,央视听大模型具备了强大的视频理解能力和视听媒体问答能力,同时,央视听大模型可根据提供的视频创作文字——从主持词到新闻稿件,甚至诗歌。媒体编辑可在大模型的协助下,一键为视频生成风格各异的解说词,当前生成内容已覆盖美食、文化和科技等多个领域。
央视听大模型还为用户提供了强大的交互式图像、视频编辑与创作能力,用户仅需使用简单的光标和文字指令,即可快速修改或编辑图像。
上海AI实验室科研团队介绍,央视听大模型具备的视觉理解能力,源于跨模态互动技术的最新突破——大模型将图像/视频视为另一种“语言”,并将视觉与语言对齐,从而降低人工智能视觉任务的门槛。基于对多模态数据的建模,央视听大模型可感知图像的风格与纹理笔触,通过将用户输入的文本指令与图像对齐,实现按照用户需求生成画面及风格一致的其他内容。
除了视频内容,央视听大模型还具备快速生成“数字人主播”的能力。使用较短的真人采集视频即可生成对应的数字人。AI生成的数字人主播以“真人”形象呈现,不仅能根据既定文案和背景场景快速生成播报视频,还可自动学习真人的语言及动作习惯,做到形象更逼真,表情更自然。
0001
评论列表
共(0)条相关推荐
生成式AI走进小学生「编程第一课」:画条线生成音乐、草图一秒变大作
在经典作品《小王子》中,有这样一幕情节:一个小孩子画下了蛇吞象的样子,他向大人们展示自己的作品,并问他们害不害怕。然而,所有的成年人都说:「一顶帽子有什么可怕的?」但对于充满想象力的孩子来说,这并不是一顶帽子,而是一条正在消化大象的蟒蛇:相信每一位读者都曾被这段情节所打动,这就是艺术创作的精髓所在。对于小朋友来说,即使是几笔简单的线条,也代表着最纯真可爱的想象。站长网2023-09-06 18:46:270000开源涂鸦AI绘画工具Scribble Diffusion 草图一键变精致
ScribbleDiffusion是一款利用人工智能将草图转化为精细图像的工具。它通过Replicate平台驱动,使用开源机器学习模型ControlNet生成图像,并通过Next.js和TailwindCSS构建了用户友好的界面。用户可以在ScribbleDiffusion网站上使用该工具,将草图快速转化为更精细的图像。站长网2023-08-04 14:26:570001研究:ChatGPT或币医生更好的遵循抑郁症治疗指南
划重点:1.AIChatGPT被认为可能比医生更好地遵循抑郁症的治疗标准,而且没有性别或社会阶层偏见。2.研究发表在英国医学杂志旗下的开放获取期刊《FamilyMedicineandCommunityHealth》上。3.ChatGPT与1,249名法国初级医生进行了比较,结果显示其在遵循抑郁症治疗指南方面表现出更高的准确性。站长网2023-10-18 11:43:050000开播一个月收入100万,淘宝加码“内容主播”
这可能是淘宝直播诞生以来,对内容扶持力度最大的时候。近日,有商家向《电商在线》反映,有大批内容主播集体入淘,其中部分由MCN机构引进,主播来源既包含抖音、快手上成熟的内容达人,也包含一些从零孵化的内容主播。站长网2023-04-21 15:59:070000在游戏开发中,如何平衡 GPT-3.5 和 GPT-4 的成本与性能?
【CSDN编者按】在成本允许的条件下,从性能方面考虑自然优先选择GPT-4;但考虑到游戏成本,适当“降级”到GPT-3.5似乎也在情理之中。那么,作为一名游戏开发者而言,具体要如何抉择呢?站长网2023-11-20 17:05:330000