南京大学发布AvatarBooth 可用文本生成3D人类化身
过去,元宇宙曾经大热,但之后却被冷落。一个很大的原因是生成3D化身的方法大多需要昂贵且复杂的采集设备,以构建高保真的化身模型。因此,对于消费级别的应用开发来说难以负担。
现在,南京大学的研究人员提出了一种全新的方法AvatarBooth。该方法可以生成高质量和可定制的化身,能够准确反映特定个体的视觉和文字特征。与之前只能基于简单文本描述生成化身的方法不同,该方法可以根据任意捕获的面部或身体图像生成个性化头像,并支持基于文本的模型生成和编辑。
论文链接:https://arxiv.org/pdf/2306.09864.pdf
项目链接:https://zeng-yifei.github.io/avatarbooth_page/
AvatarBooth通过学习一个神经隐含表面来表示人类化身的形状和外观。该模型使用脸部和身体的预训练或微调的潜扩散模型来监督学习。姿势一致的约束被提出,在外观定制生成的任务中加强了扩散模型的微调,提供了更准确的多视图监督,在姿势空间中具有一致的外观。模型中还包括一个多分辨率的SDS方案,可以从粗到细地预测化身的精细结构和外观。
只需要一人的几张照片,模型就可以合成3D化身。化身不仅具有个性化独特的外观,而且还可以符合输入文本提示中指定的抽象特征,如「戴眼镜」或「某种风格的帽子」等属性。用户可以方便地编辑和修改化身的整体视觉形象。
为了量化化身生成质量,研究人员招募了30名志愿者,并使用对比方法CLIP-Actor、AvatarCLIP和TEXTure生成了10个化身。每个用户都从四个方面(与文本提示的对应性、外观质量、几何质量和面部的保真度)对结果进行评估,分数范围从1(最差)到5(最好)。结果表明,文中提出的新方法在四个指标上都获得了最高分,证明该模型有能力生成具有更详细外观和几何形状的化身。
FF:美国著名说唱歌手Chris Brown成为第五位FF19车主
据法拉第未来官方消息,全球巨星兼企业家克里斯布朗在过去一个月里,经过试驾和体验FF912.0FuturistAlliance后,正式成为了这款车的第五位车主。现在,克里斯布朗已身兼FF车主及开发者共创官两重身份,他已向FF提供了宝贵的反馈意见,这些意见不仅会进一步完善属于他的FF912.0,也会对提升FF的整体用户体验起到推动作用。站长网2023-11-06 16:00:250000BiTA:创新AI方法加速大型语言模型生成
**划重点:**-🚀**加速语言模型推理:**BiTA通过双向调优和简化的SAR草稿验证,实现对自回归语言模型(AR)的无损加速,为公开可访问的基于transformer的LLMs提供插拔式模块,特别适用于聊天机器人等实时应用。-🌐**双向调优与树状解码:**BiTA采用双向调优和树状解码技术,通过在单个前向传递中同时生成和验证多个标记,提高了LLMs的生成效率。。站长网2024-02-02 14:18:250000快手短剧日均DAU达2.7亿 创作者数量突破10万
在最新的快手短剧生态大会上,快手副总裁兼快手文娱业务负责人陈弋弋透露快手星芒短剧在2023年的惊人成绩。这次的盛会将目光聚焦在短剧创作和观众规模的增长,以及快手短剧在娱乐市场的卓越表现。0000Nature|AI检测器又活了?成功率高达98%,吊打OpenAI
OpenAI都搞不定的问题,被堪萨斯大学的一个研究团队解决了?他们开发的学术AI内容检测器,准确率高达98%。如果将这个技术再学术圈广泛推广,AI论文泛滥的可能得到有效缓解。现在AI文本检测器,几乎没有办法有效地区分AI生成的文字和人类的文字。就连OpenAI开发的检测工具,也因为检测准确率太低,在上线半年后悄悄下线了。站长网2023-11-13 21:47:430000全球首搭字节豆包AI大模型!全新smart精灵#5发布
快科技8月28日消息,smart精灵#5在澳大利亚布里斯班举行了全球首发仪式。据悉,这款车型基于SEA浩瀚架构打造,采用800V平台,拥有CLTC最高740km的续航里程。作为smart品牌迄今为止尺寸和空间最大的车型,smart精灵#5定位为大五座SUV,标志着品牌在设计和技术上的新里程碑。0000