阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
站长网2024-04-26 22:26:071阅
站长之家(ChinaZ.com)4月26日 消息:阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。
如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。
通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。

EMO模型是通义实验室精心研发的AI模型,其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比,EMO模型采用了创新的弱控制设计,无需对人脸、人头或身体部分进行繁琐的3D建模,即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本,还显著提升了视频的质量。
EMO模型具备强大的学习能力,能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配,甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上,使得生成的视频更加生动逼真。
自2月底通义实验室公布相关论文以来,EMO模型便受到了广泛关注,成为继Sora之后最受瞩目的AI模型之一。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。
通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外,通义APP还推出了众多现象级应用,如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等,这些应用背后的模型也均出自通义实验室。此外,通义APP还不断推出实用功能,如超长文档解析、AI编码助手、AI会议助手等,为用户提供全方位的超级AI助手服务。
体验地址:https://top.aibase.com/tool/tongyiqianwen
0001
评论列表
共(0)条相关推荐
GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!
【新智元导读】多模态大模型的战场上,已有人闻到风声。据外媒爆料,OpenAI的全新多模态模型Gobi似乎已在筹备中。谷歌和OpenAI的这场对决,似乎已是箭在弦上了。随着今年秋天的临近,谷歌和OpenAI的多模态模型之战,也进入到白热化阶段。就在上周,谷歌已经对一些外部公司开放了多模态大模型Gemini的功能。站长网2023-09-19 18:23:270000史上最贵“蹦迪票”!神秘买家8万拍下椰树直播间蹦迪权:1秒单价2698元
直播带货早已成为如今大大小小商家营销的主要方式,面对同质化的直播风格,椰树集团的直播方式熟悉”又新颖。日前,椰树集团入驻淘宝直播,直播首秀前,椰树在淘宝拍卖上上架直播间蹦迪权”,50元起拍,拍中的粉丝就能在直播间和椰树模特团共舞30秒。目前,这张蹦迪票”拍卖结果已经出炉,由一位神秘买家花80930的价格拍下,堪称史上最贵蹦迪票”。站长网2023-06-03 15:40:240000目标检测跟踪模型YOLOv8 能快速识别和定位多个对象
YOLOv8是一种先进的目标检测跟踪模型,它在图像或视频帧中能够快速准确地识别和定位多个对象,并能够跟踪它们的移动,同时将其分类。除了检测对象,YOLOv8还可以区分对象的确切轮廓,进行实例分割、估计人体的姿态、帮助识别和分析医学影像中的特定模式等多种计算机视觉任务。项目地址:https://github.com/ultralytics/ultralyticsYOLOv8的主要功能包括:站长网2024-02-21 14:46:070004小米14影像系统跨越式升级 首发搭载光影猎人传感器
小米14系列将于10月26日晚正式发布,官方今日公布了关于影像方面的预热信息。小米与徕卡联合打造了新镜头,并带来了全新的影像传感器品牌光影猎人。小米14将首发搭载光影猎人传感器,具备全时态、全场景下的超强瞬间精准捕捉能力。雷军亲自透露:“小米14影像系统跨越式升级,标准版就已经强到不可思议的程度。”站长网2023-10-24 21:42:180000曝iPhone17将推Slim机型 取代现有“Plus”系列
站长之家(ChinaZ.com)5月6日消息:知名分析师JeffPu透露,iPhone17系列将展现“焕然一新的设计”,并带来前置摄像头的改进以及更为紧凑的灵动岛设计。其中,JeffPu预测苹果将推出一款全新的“iPhone17Slim”机型,该机型旨在取代现有的“Plus”系列。但值得注意的是,这款Slim机型并非iPhone12/13mini的延续,而是苹果在产品线中的一次全新尝试。站长网2024-05-06 18:48:430000