多模态SVG生成模型StarVector 视觉质量显著增强
站长网2023-12-21 11:44:260阅
StarVector是一种多模态SVG生成模型,该模型有效地集成了代码生成大型语言模型(CodeLLM)和视觉模型,使得能够生成准确表示图像像素的不受限制的SVG。
StarVector利用CLIP图像编码器从基于像素的图像中提取出视觉表示模块,然后通过适配器将其转换为视觉标记。这些视觉标记预先添加到SVG标记嵌入中,而StarCoder模型使用下一个标记预测对序列进行建模,从而有效地学习对齐标记和代码标记。
论文地址:https://arxiv.org/pdf/2312.11556.pdf
为了评估StarVector的性能,论文引入了SVG-Bench,这是一个用于跨多个数据集和相关指标评估SVG方法的综合基准。在此基准测试中,引入了新颖的数据集,包括SVG-Stack训练(真实世界SVG示例的大型数据集),并使用它来预StarVector作为SVG的大型基础模型。
结果表明,与当前方法相比,视觉质量和复杂性处理有有了显著的增强,引起SVG生成技术的显着进步。因此,StarVector为SVG生成技术带来了新的突破,为网页开发和图形设计领域带来了更多可能性。
0000
评论列表
共(0)条相关推荐
苹果WWDC2024定档:6月10日举行 iOS 18生成式AI将发布
苹果今日凌晨正式宣布,备受瞩目的WWDC2024全球开发者大会将于美国太平洋时间6月10日至14日盛大举行。今年的大会预计将以AI为主题,届时将发布一系列令人期待的新操作系统,包括iOS18、iPadOS18、macOS15、tvOS18、watchOS11以及visionOS2。站长网2024-03-27 12:54:200000斯坦福大学发布2024年人工智能指数报告:十大要点解析
在2024年4月19日,斯坦福大学以人为中心的人工智能研究所发布了其备受瞩目的2024年人工智能指数报告。这份全面的研究报告深入分析了人工智能(AI)的现状,探讨了主要趋势、进步和挑战。随着AI技术以惊人的速度重塑世界,该报告为理解这一变革性技术提供了宝贵的资源。以下是2024年人工智能指数报告的十大要点:站长网2024-04-22 15:11:450000文娱行业的618:粉丝韭菜不好割,消费者的钱也不好赚
剧综流量一般,直播带货狂飙。“直播带货”的风,在这个618期间,吹向了整个文娱行业。早在两年前,明星直播带货碎滤镜的讨论已经甚嚣尘上。当明星们无戏可拍时,走进直播间卖低价产品成了他们的选择,伴随着统一色调的滤镜、嘈杂的叫卖声、以及偶尔的讲价演戏,艺人们的星光也相应黯淡。站长网2023-06-18 23:41:070000对话王小川:大语言模型是起点,AGI时代已经到来
中国的互联网圈,科技圈的少有这么热闹的时候。上周,王小川在搜狐网络大厦召开了一场发布会,重点讲了一件事:我,王小川要加入中国大模型创业大军。为什么说是创业大军呢?因为就在发布会楼上的办公区,美团联合创始人王慧文也在此开启了大模型创业项目“光年之外”。除了他们之外,还有其他不少创业者们都涌进了大模型创业赛道。站长网2023-04-18 13:55:530000DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero
文章概要:1.谷歌DeepMind开发了一个集成系统AZdb(AlphaZeroDb),将多个AlphaZero代理组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。2.AZdb代理使用行为多样性和响应多样性,创造独特下棋风格,更好适应不同对手和新局面。3.测试显示,AZdb解决两倍难题,ELO评分提高50分,优于旧版AlphaZero。站长网2023-08-26 16:14:330000