SD3.5官方教程：5大重要框架，教你用文本生成精准图片

站长网2025-01-04 10:32:050阅

很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时，总是感觉生成的图片和预期的相差甚远。

今天就用Stability.ai发布的SD3.5官方教程为大家解读一下，如何用最贴切的文本提示词来生成精准的图片。

确定你的图片风格

风格在图像创作中起着决定性的引领作用，明确了图像整体的审美走向。若倾向于插画风格，画面可能会呈现出鲜明的绘画笔触与丰富的色彩层次，具有较强的艺术表现力;

绘画媒介方面，如水彩会带来清新、透明且晕染自然的视觉感受，油画则以其厚重的质感与细腻的色彩过渡令人瞩目;

数字艺术风格能展现出科技感与奇幻元素的融合，充满无限创意;摄影风格则可营造出逼真的场景还原度。

尝试混合风格更是能碰撞出奇妙的火花，比如线条艺术可赋予图像简洁而富有张力的轮廓，如一幅以线条勾勒的城市夜景，硬朗的线条描绘出高楼大厦的轮廓，在黑暗背景下凸显出城市的冷峻与现代感。水彩风格能为画面增添柔和与灵动，像是一幅描绘春日花园的水彩画，淡雅的色彩晕染出花朵的娇艳与草地的青葱。

文本提示词案例:融合了浮世绘的细腻线条与西方印象派色彩的插画风格，背景是一幅以柔和水彩描绘的樱花林，前景则是一个穿着传统和服站立的人物，采用油画质感来突出主体。

主体和动作

当图像存在主体时，在提示词中首先突出主体的存在是极为关键的，这能让模型迅速聚焦于核心元素，随后描述主体的动作则可赋予图像动态感与故事性。

例如 “一只灵动的孔雀在花园中悠然开屏”，这里 “一只灵动的孔雀” 明确了主体，而 “在花园中悠然开屏” 则展现了孔雀的动作，生成的图像可能是孔雀站在繁花似锦的花园中央，绚丽的羽毛缓缓展开，形成一个五彩斑斓的扇形，阳光洒在羽毛上折射出迷人的光彩。

文本提示案例:一位芭蕾舞者在舞台上跳跃，她的裙子随着旋转飘扬，周围环绕着闪烁的舞台灯光。舞者的表情专注而优雅，仿佛时间在这一刻静止。

构图和框架

通过对构图和框架的精准描述，可以引导图像呈现出特定的视觉效果。若指定特写镜头，能够将观众的注意力紧紧吸引在主体的细节之处，比如 “特写镜头下一颗晶莹剔透的露珠在花瓣边缘摇摇欲坠”，生成的画面会着重展现露珠的圆润形态、内部折射的光线以及花瓣的细微纹理，露珠仿佛即将滑落，给人一种静谧且精致的美感。

而广角视图则能展现出宏大的场景，例如 “广角视图中的古老城堡矗立在云雾缭绕的山脉之巅”，图像中城堡雄伟壮观，山脉绵延起伏，云雾在其间缭绕，营造出一种神秘而宏大的氛围。

文本提示案例:从地面仰望拍摄的特写镜头，焦点集中在一只栖息在古老橡树上的猫头鹰，它的羽毛清晰可见。背景是模糊的夜空，星星点点，营造出神秘氛围。

照明和颜色

利用诸如 “逆光”“硬边光”“动态阴影” 等专业术语来描绘场景中的照明或阴影，能够极大地丰富图像的层次感与氛围感。“逆光” 可营造出神圣而神秘的效果，比如 “逆光中的天使展开洁白的羽翼”，画面中天使背对着明亮的光源，羽翼边缘被光线勾勒出金色的轮廓，身体则处于相对较暗的区域，形成强烈的明暗对比，凸显出天使的圣洁与超凡脱俗。

“硬边光” 能塑造出硬朗、鲜明的视觉效果，例如 “硬边光下的拳击手在赛场上蓄势待发”，光线从一侧直射，在拳击手的面部和身体上形成清晰的明暗分界线，肌肉的线条和坚毅的表情被清晰地刻画出来。

“动态阴影” 则可增加画面的动感与立体感，像是 “在斑驳的动态阴影中舞者翩翩起舞”，随着舞者的舞动，周围树木投射下的阴影不断变化，与舞者的身姿相互交织，形成一幅富有节奏感的画面。

文本生成提示案例:清晨的阳光穿过窗户，形成强烈的逆光效果，在房间内投射出长长的影子。画面以暖色调为主，墙壁呈现出淡淡的橙黄色，地板上散布着金色的光斑。

技术参数设置

使用电影术语来指定技术参数，有助于精确地把控图像的视角与框架。“鸟瞰视角” 能够提供一种宏观的、俯瞰全局的视野，例如 “鸟瞰视角下的城市交通网络如脉络般纵横交错”，生成的图像会呈现出城市高楼大厦间道路的布局，车辆如蚂蚁般在道路上穿梭，展现出城市的繁忙与有序。

“特写” 可聚焦细节，如 “特写一颗古老的树桩上岁月留下的纹理”，图像会将树桩的纹理清晰地放大，展现出其历经风雨后的沧桑质感。

“摇臂镜头” 能营造出灵动且富有变化的视觉感受，比如 “摇臂镜头跟随滑板少年在街头巷尾穿梭”，画面会模拟摇臂拍摄的效果，随着滑板少年的移动，视角不断变化，街道两旁的建筑和人群快速掠过，给人一种身临其境的动感。

“广角镜头” 则可收纳更多的场景元素，例如 “广角镜头中的海边落日余晖洒在金色的沙滩上”，图像中广阔的沙滩、浩瀚的大海以及天边绚丽的落日都能被完整地呈现，营造出一种开阔而浪漫的氛围。

文本提示案例:采用鸟瞰视角，从天空向下看一座繁华的城市夜景，街道灯火通明，车流不息，霓虹灯牌闪烁，给人一种现代都市的活力感。

SD35官方教程5大重要框架教你用文本生成精准图片

0000

评论列表

共(0)条

相关推荐

站长资讯
亚马逊推出搭载英伟达 H100 GPU 的新 Amazon EC2 P5 实例助力 AI 训练与推理
站长之家(ChinaZ.com)7月27日消息:AWS用户现在可以访问AI训练和推理领域业界基准测试中展示的领先性能。图片来自NVIDIA这家云计算巨头正式推出了由英伟达H100TensorCoreGPU提供支持的新AmazonEC2P5实例。该服务允许用户通过浏览器一键扩展生成式AI、高性能计算（HPC）和其他应用程序。
站长网2023-07-27 09:59:03
0001
站长资讯
花2980被割韭菜？大V不要做低价社群，又累又不赚钱还烂口碑！
各位村民好，我是村长。就在前不久，关于某大V收了2980的社群会员费，割了一波韭菜。在社群、IP圈子搞得沸沸扬扬，余波未平。会员交了2980以后，刚入群的前几天，群里面还是比较热闹的，还有新人发红包、小助理活跃气氛。但是现在群里面没有新人加入了、也没有分享有价值的信息、小助理也换了四五波人。该会员最早是被这位大V的才华、影响力所吸引，抱着期待加入社群的。
站长网2023-07-04 15:58:11
0000
站长资讯
新型神经网络ResFields 擅长理解随时间变化的复杂 3D 场景
ResFields提出了一种新的神经网络结构，可以更好地表示复杂的时空信号。该方法的核心思想是在多层感知机（MLP）中替换一个或多个层，使用依赖时间的可训练残差权重参数。这种结构可以显著提升MLP的时空建模能力。项目地址:https://markomih.github.io/ResFields/
站长网2023-09-13 10:26:49
0000
站长资讯
时装品牌Selkie创始人：生成式人工智能可以成为艺术家的工具
在社交媒体平台Instagram和TikTok上风靡一时的时尚品牌Selkie，近日宣布推出备受期待的情人节系列，然而，该系列的设计却引发了一场关于人工智能在艺术中使用的激烈争议。
站长网2024-01-22 09:55:22
0000
站长资讯
稚晖君刚拿了百度投资，估值被曝已超独角兽
“华为天才少年”稚晖君创业项目，刚被百度投了!量子位获悉，稚晖君创业项目智元机器人，日前完成了第三轮融资，市场估值被曝在十几亿美元左右。天眼查App显示，本轮新增股东包括李彦宏旗下三亚百川致新私募股权投资基金合伙企业（有限合伙），以及经纬、高榕等一线VC，注册资本增至约4847.02万元。智元机器人关联公司名为上海智元新创技术有限公司，成立于2023年2月，法定代表人为舒远春。
站长网2023-05-30 14:05:04
0001