多模态SVG生成模型StarVector 视觉质量显著增强
站长网2023-12-21 11:44:260阅
StarVector是一种多模态SVG生成模型,该模型有效地集成了代码生成大型语言模型(CodeLLM)和视觉模型,使得能够生成准确表示图像像素的不受限制的SVG。
StarVector利用CLIP图像编码器从基于像素的图像中提取出视觉表示模块,然后通过适配器将其转换为视觉标记。这些视觉标记预先添加到SVG标记嵌入中,而StarCoder模型使用下一个标记预测对序列进行建模,从而有效地学习对齐标记和代码标记。

论文地址:https://arxiv.org/pdf/2312.11556.pdf
为了评估StarVector的性能,论文引入了SVG-Bench,这是一个用于跨多个数据集和相关指标评估SVG方法的综合基准。在此基准测试中,引入了新颖的数据集,包括SVG-Stack训练(真实世界SVG示例的大型数据集),并使用它来预StarVector作为SVG的大型基础模型。
结果表明,与当前方法相比,视觉质量和复杂性处理有有了显著的增强,引起SVG生成技术的显着进步。因此,StarVector为SVG生成技术带来了新的突破,为网页开发和图形设计领域带来了更多可能性。
0000
评论列表
共(0)条相关推荐
iPad Pro/Air双剑齐发!苹果发布会仅35分钟
快科技5月6日消息,据爆料人MarkGurman透露,苹果将于5月7日举行的发布会预计仅持续35分钟,届时将推出4款新品:iPadPro、iPadAir、ApplePencil和妙控键盘。其中新款iPadPro将提供11英寸和12.9英寸两种尺寸,首次采用OLED屏幕,支持LTPO技术和120HzProMotion显示,采用双串联结构,具有高亮度、长寿命和更好的电池续航表现。站长网2024-05-06 10:54:540000网友用Runway自制AI科幻短片 20秒大秦帝国星汉远征抖音获赞4.9万
近日,一部名为《架空历史:大秦帝国-第一次星汉远征》的AI制作的科幻短片在网络上引起了广泛关注。这部短片由抖音博主“AIGC西瓜头”于4月20日发布,讲述了一个大胆而富有创意的故事——大秦帝国为应对外星异族的侵扰,决定向外星异族的母星发起进攻。站长网2024-04-24 15:50:110000蜂花洗头、白象泡面,老国货掀起“最朴实无华”的商战
让人没想到的是,李佳琦和花西子的舆论风波,带火了一批老国货。先是蜂花在抖音旗舰店里连夜上架了多款洗护套餐,售价都是79元,跟李佳琦直播间的花西子眉笔价格相同,但包含的洗护产品净含量足足有5斤半多。这波操作下来,蜂花的79元套餐直接卖断货,一天里涨粉50万,被网友戏称为“朴实无华的商战”。站长网2023-09-16 09:48:260001同花顺申请注册CHATBOND商标
天眼查App显示,近日,浙江核新同花顺网络信息股份有限公司申请注册CHATBOND商标,国际分类为科学仪器、网站服务,当前商标状态为申请中。据了解,同花顺公司成立于2001年,主要客户涵盖金融市场的各层次参与主体。同花顺表示,将在现有的业务、技术、用户、数据等基础及优势上,积极探索、开发基于人工智能、大数据、云计算、金融工程、人机交互等前沿技术的产品及应用,形成公司新的业务模式和增长点。站长网2023-05-05 14:18:020000一线手札:银行私域营销的困局
大部分银行在做私域时,会遇到很多来自组织上的难题。比如总行、省行、分行、支行(网点)、员工会分别有不同的立场和角度,在很多情况下,私域营销并没有获得行内所有人、甚至大多数人的支持。以及银行私域由哪个部门管理也是个难题。但即便在组织上会遇到很多难题,2023年下半年仍然是银行私域建设的窗口期。无论自身条件完备与否,启动就比不启动好。0000