19650

Design2Code：提供设计图，让多模态LLM自动生成前端代码

站长网2024-03-07 16:44:190阅

划重点:

⭐️ 生成 AI 在近年来取得了快速进展，具有前所未有的多模态理解和代码生成能力。

⭐️ 研究对可视化设计转换为代码实现的任务进行了系统研究，提出了一套自动评估指标。

⭐️ GPT-4V 在任务中表现出色，生成的网页在视觉外观和内容方面有望取代原始参考网页。

近年来，生成 AI 在多模态理解和代码生成方面取得了显著进展，为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务（称为 Design2Code）的系统研究。

Design2Code是一个微软的开源项目，目的是实现提供设计图，转换为前端代码，适用于前端开发者和设计师。

研究人员手动筛选了484个真实网页作为测试用例，并开发了一套自动评估指标，以评估当前多模态 LLMs 能够多大程度上生成直接渲染为给定参考网页的代码实现，以屏幕截图作为输入。

研究人员开发了一套多模态提示方法，并展示了它们在 GPT-4V 和 Gemini Vision Pro 上的有效性。他们还对开源的 Design2Code-18B 模型进行了微调，成功达到了 Gemini Pro Vision 的性能水平。

测试集示例

基准测试中的一些示例（用于评估目的;下面两行）与 Huggingface 创建的合成数据(用于训练目的;第一行)进行比较。基准测试包含具有不同复杂程度的各种现实世界网页。

人类评估和自动指标显示，GPT-4V 在这一任务中表现出色，标注者认为 GPT-4V 生成的网页在视觉外观和内容方面有望在49% 的情况下取代原始参考网页。令人惊讶的是，在64% 的情况下，标注者认为 GPT-4V 生成的网页甚至比原始参考网页更好。

基准性能:自动指标

对于自动评估，考虑高级视觉相似性（CLIP）和低级元素匹配(块匹配、文本、位置、颜色)。

模型对比

一些案例研究示例来比较不同的提示方法和不同的模型。

详细的细分指标表明，开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后，而在文本内容和着色方面则可以通过适当的微调得到显著改进。

项目入口：https://top.aibase.com/tool/design2code

Design2Code提供设计图让多模态LLM自动生成前端代码

0000

评论列表

共(0)条

相关推荐

站长资讯
热门5G手机市占率排名：华为P40 Pro国产机 5G平分天下
快科技4月30日消息，日前，每日互动发布《2023年一季度5G手机报告》，报告显示，2023年一季度5G手机在智能手机市场占有率达48.2%，同比增长32.8%。具体来看，iPhone5G手机以20.8%的市占率排名第一，vivo以19.0%市占率排名第二，OPPO5G手机排名第三，市占率达16.2%，荣耀第四，市占率12.9%，华为5G手机虽然断更”，但市占率依然有12.6%，进入前五。
站长网2023-05-12 20:38:18
0000
蔚来宣布获阿布扎比CYVN新一轮22亿美元战略投资
快科技12月18日消息，蔚来宣布与阿布扎比投资机构CYVNHoldings签订新一轮股份认购协议，CYVNHoldings将通过其附属公司CYVNInvestments以现金形式向蔚来进行总计约22亿美元的战略投资。此次投资完成后，蔚来和CYVN将继续共同在国际市场上开展战略和技术合作。今年7月，CYVN曾通过定向增发新股和老股转让的方式完成总计约11亿美元的战略投资。
站长网站长资讯2023-12-18 19:53:28
0001
站长资讯
谷歌计划将广告与 AI 聊天机器人对话体验相结合
AI聊天机器人刚刚进入普通用户的视野，但科技巨头们正急于将其商业化。例如，微软的BingChat推出不久后，就开始在对话中植入广告。如今，谷歌也表示将采取类似的做法，在其通过最近宣布的SearchGenerativeExperience（SGE）提供的对话式AI体验中运行搜索和购物广告。
站长网2023-05-24 17:52:31
0000
站长资讯
雷军：2025年小米汽车工厂逐步开放参观每次限20人
快科技1月4日消息，雷军今天发文透露，小米汽车工厂已开放对外参观预约，同时宣布将在2025年逐步开放参观。点击小米汽车App社区-官方-顶部banner，填写报名信息并选择参观时间。官方将在小米汽车App公布入选名单，并电话方式通知。为保证参观质量，每场参观限定20组客人，每周六14:00-17:00（限生产时间）。
站长网2025-01-05 00:07:43
0000
站长资讯
老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题
【新智元导读】刚刚，老黄又高调向全世界秀了一把:已经量产的Blackwell，8年内将把1.8万亿参数GPT-4的训练能耗狂砍到1/350;英伟达惊人的产品迭代，直接原地冲破摩尔定律;Blackwell的后三代路线图，也一口气被放出。就在刚刚，老黄手持Blackwell向全世界展示的那一刻，全场的观众沸腾了。它，是迄今为止世界最大的芯片!眼前的这块产品，凝聚着数量惊人的技术
站长网2024-06-03 15:36:17
0000