美图吴欣鸿:自研视觉大模型MiracleVision已迭代至1.5版本
站长网2023-08-04 08:23:130阅
8月3日,美图创始人、董事长兼CEO吴欣鸿参加第四届中国人工智能大赛成果发布会。在会上,吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。
吴欣鸿认为,垂直大模型 应用场景 商业模式是大趋势。美图拥有深厚的计算机视觉技术沉淀,针对视觉领域搭建了完善的模型算法架构。美图在图片、视频、设计、数字人等领域具有丰富的应用场景和落地经验。此外,美图拥有清晰商业模式,可以让视觉大模型快速变现。
据悉,目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。“AI写真”可以帮助训练用户专属的AI模型,革新传统影楼拍摄方式。“AI扩图”能大幅提高图片素材利用率,拓展图片边界,同时用于生活与商业场景。
此外,美图设计室推出“AI潮鞋”功能,联合华为云发布SaaS应用“AI模特试衣”,为服装电商提供一站式AI解决方案。
吴欣鸿表示,美图自研视觉大模型可以帮助用户提高生产力、助力产业数字化升级。同时,也能在“深化社会美学素养”、“提升全民数字技能”上发挥重要作用。
0000
评论列表
共(0)条相关推荐
前京东集团副总裁成立生成式AI公司HiDream.ai
据36氪报道,前京东集团副总裁、京东探索研究院副院长梅涛自今年初离职后,确认在AI领域创业,成立生成式AI公司HiDream.ai,方向是生成式视觉多模态基础模型与应用。梅涛表示,当前的生成式AI视觉领域产品普遍存在优化空间,HiDream.ai的目标即是“对标并超越它们,成为世界级产品”。站长网2023-06-16 16:20:450000Mujoco3开源:物理仿真器速度更快 稳定性大大提高
DeepMind宣布最新版本的MuJoCo3,该版本引入了加速硬件支持,对CPU进行了性能和内存占用的改进,以及更多灵活的碰撞原语。MuJoCo3支持通过新的MuJoCoXLA(MJX)模块进行加速模拟,可以在GoogleCloudTPU或自有加速硬件上以每秒数百万步的速度运行MuJoCo模拟。MJX通过运行在专门的硬件上,提供独特的性能特点,但可能需要一些模型调整。站长网2023-10-20 10:07:250001谷歌 DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID
GoogleDeepMind的AILyria模型创建的音频,包括使用YouTube新音频生成功能制作的曲目,将使用SynthID水印标记,以便人们在事后识别它们的AI生成来源。在一篇博客文章中,DeepMind表示这种水印人耳不会察觉,并且「不会损害听觉体验」,并补充说即使音频轨道被压缩、加速或减速,或者添加了额外噪音,水印仍应可被检测到。站长网2023-11-17 10:14:010000InstantID模型发布 相比PhotoMaker保留了良好的文本可编辑性
人脸身份保持项目InstantID正式发布模型。与PhotoMaker和IP-Adapter-FaceID相比,InstantID实现了更好的保真度并保留了良好的文本可编辑性。这个项目的发布受到了广泛关注,因为它能够更好地融合面孔和样式,提供更真实的身份保持体验。站长网2024-01-23 09:44:590001Meta 推出雷朋智能眼镜的多模态 AI 功能测试:可识别物体并翻译语言
站长之家(ChinaZ.com)12月13日消息:Meta宣布将开始推出其多模态AI功能的早期访问测试,这些功能将应用于MetaRay-Ban(雷朋)智能眼镜,能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在Instagram的一个视频中展示了这次更新,他询问眼镜建议哪种裤子与他手里拿着的衬衫相配。站长网2023-12-13 09:37:480000