腾讯混元文生图大模型宣布开源:首个中文原生DiT架构
站长网2024-05-14 15:43:450阅
今日,腾讯旗下引人注目的混元文生图大模型(混元DiT)宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在Hugging Face和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。
腾讯混元文生图大模型的负责人卢清林表示,混元DiT的开源具有双重价值。首先,作为业内首个中文原生DiT架构,它填补了开源社区的空白,为中文领域的多模态视觉生成提供了强有力的支持。其次,混元DiT的开源是全面开放的,与现网版本完全一致,保证了开发者和用户能够获取到最先进、最实用的技术。
此次开源的混元DiT采用了与Sora同样的关键技术DiT架构,不仅支持256字中文理解,还能够作为视频等多模态视觉生成的基础。为了实现这一功能,腾讯团队精心设计了Transformer结构、文本编码器和位置编码,并构建了完整的数据管道,用于持续更新和评估数据,为模型的优化迭代提供了有力支持。
值得一提的是,混元DiT还通过训练多模态大语言模型来优化图像的文本描述,实现了细粒度的文本理解。这使得用户能够与之进行多轮对话,根据上下文生成并完善图像,为创意设计和内容创作提供了无限可能。
腾讯混元文生图大模型的全面开源,无疑将为全球的开发者和用户带来更为广阔的创新空间和应用前景。我们期待这一技术的进一步发展和应用,为人工智能领域带来更多的惊喜和突破。
项目地址:https://github.com/Tencent/HunyuanDiT
0000
评论列表
共(0)条相关推荐
亚马逊否认计划使用AI完成《Road House》续集
##划重点:-📰亚马逊否认考虑使用人工智能完成即将上映的《RoadHouse》续集,针对对制片人乔尔·席尔弗(JoelSilver)的指控,亚马逊强烈否认有任何使用AI的计划。-🎬制片人席尔弗据称因反对在罢工期间使用AI制作《RoadHouse》而被开除,亚马逊发言人表示这一指控毫无真实性。站长网2023-12-01 12:16:340000网易互娱AI Lab图像生成论文被AI顶会接收
网易互娱AILab的一篇学术论文《GeneralImage-to-ImageTranslationwithOne-ShotImageGuidance》被国际计算机视觉顶级学术会议ICCV2023接收。该论文提出了一种名为VCT(视觉概念转换器)的图像编辑技术,可以通过一张参考图像将物体或风格转移到源图像上,同时保持源图像的整体结构不变。站长网2023-08-08 11:48:550000小米高管否认卖一部SU7亏6800元:与实际偏差较大
站长之家(ChinaZ.com)4月15日消息:近日,花旗发布了一份关于小米集团SU7的预测报告,其中指出该车型在4月份的交付量有望达到5000至6000部,全年交付量预计将在5.5万至7万台之间。这一数据体现了市场对小米汽车业务的积极预期。然而,报告同时也指出,小米在2024年每卖出一部SU7可能会亏损6800元,全年造车业务预计亏损将达到41亿元。这一亏损预测引发了市场的关注和讨论。站长网2024-04-18 15:38:200001恒生电子:恒生大模型产品LightGPT已开启内测
恒生电子宣布,恒生大模型产品已面向20家金融机构开启内测。据悉,恒生金融行业大模型LightGPT是专为金融领域打造的大语言模型,具有更专业、更合规和更轻量的特点。它通过训练海量金融数据,对金融相关问题有更好的理解能力,有助于推动大模型在金融行业的应用。站长网2023-09-25 11:28:220000手握10万主播达人,无忧传媒攻不下电商
无忧传媒持续加码电商直播业务,与互联网监管日趋严格,秀场直播行业有关。虽然目前无忧传媒已经在电商直播赛道展露头角,但值得注意的是,目前其仅有几个知名的电商主播,与超十万的主播达人大盘相比,显得微不足道。为了扩大电商业务的影响力,无忧传媒已不满足于抖音内部的流量。站长网2023-07-04 16:18:100001