SD3.5官方教程:5大重要框架,教你用文本生成精准图片
很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。
今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。
确定你的图片风格
风格在图像创作中起着决定性的引领作用,明确了图像整体的审美走向。若倾向于插画风格,画面可能会呈现出鲜明的绘画笔触与丰富的色彩层次,具有较强的艺术表现力;
绘画媒介方面,如水彩会带来清新、透明且晕染自然的视觉感受,油画则以其厚重的质感与细腻的色彩过渡令人瞩目;
数字艺术风格能展现出科技感与奇幻元素的融合,充满无限创意;摄影风格则可营造出逼真的场景还原度。
尝试混合风格更是能碰撞出奇妙的火花,比如线条艺术可赋予图像简洁而富有张力的轮廓,如一幅以线条勾勒的城市夜景,硬朗的线条描绘出高楼大厦的轮廓,在黑暗背景下凸显出城市的冷峻与现代感。水彩风格能为画面增添柔和与灵动,像是一幅描绘春日花园的水彩画,淡雅的色彩晕染出花朵的娇艳与草地的青葱。
文本提示词案例:融合了浮世绘的细腻线条与西方印象派色彩的插画风格,背景是一幅以柔和水彩描绘的樱花林,前景则是一个穿着传统和服站立的人物,采用油画质感来突出主体。
主体和动作
当图像存在主体时,在提示词中首先突出主体的存在是极为关键的,这能让模型迅速聚焦于核心元素,随后描述主体的动作则可赋予图像动态感与故事性。
例如 “一只灵动的孔雀在花园中悠然开屏”,这里 “一只灵动的孔雀” 明确了主体,而 “在花园中悠然开屏” 则展现了孔雀的动作,生成的图像可能是孔雀站在繁花似锦的花园中央,绚丽的羽毛缓缓展开,形成一个五彩斑斓的扇形,阳光洒在羽毛上折射出迷人的光彩。
文本提示案例:一位芭蕾舞者在舞台上跳跃,她的裙子随着旋转飘扬,周围环绕着闪烁的舞台灯光。舞者的表情专注而优雅,仿佛时间在这一刻静止。
构图和框架
通过对构图和框架的精准描述,可以引导图像呈现出特定的视觉效果。若指定特写镜头,能够将观众的注意力紧紧吸引在主体的细节之处,比如 “特写镜头下一颗晶莹剔透的露珠在花瓣边缘摇摇欲坠”,生成的画面会着重展现露珠的圆润形态、内部折射的光线以及花瓣的细微纹理,露珠仿佛即将滑落,给人一种静谧且精致的美感。
而广角视图则能展现出宏大的场景,例如 “广角视图中的古老城堡矗立在云雾缭绕的山脉之巅”,图像中城堡雄伟壮观,山脉绵延起伏,云雾在其间缭绕,营造出一种神秘而宏大的氛围。
文本提示案例:从地面仰望拍摄的特写镜头,焦点集中在一只栖息在古老橡树上的猫头鹰,它的羽毛清晰可见。背景是模糊的夜空,星星点点,营造出神秘氛围。
照明和颜色
利用诸如 “逆光”“硬边光”“动态阴影” 等专业术语来描绘场景中的照明或阴影,能够极大地丰富图像的层次感与氛围感。“逆光” 可营造出神圣而神秘的效果,比如 “逆光中的天使展开洁白的羽翼”,画面中天使背对着明亮的光源,羽翼边缘被光线勾勒出金色的轮廓,身体则处于相对较暗的区域,形成强烈的明暗对比,凸显出天使的圣洁与超凡脱俗。
“硬边光” 能塑造出硬朗、鲜明的视觉效果,例如 “硬边光下的拳击手在赛场上蓄势待发”,光线从一侧直射,在拳击手的面部和身体上形成清晰的明暗分界线,肌肉的线条和坚毅的表情被清晰地刻画出来。
“动态阴影” 则可增加画面的动感与立体感,像是 “在斑驳的动态阴影中舞者翩翩起舞”,随着舞者的舞动,周围树木投射下的阴影不断变化,与舞者的身姿相互交织,形成一幅富有节奏感的画面。
文本生成提示案例:清晨的阳光穿过窗户,形成强烈的逆光效果,在房间内投射出长长的影子。画面以暖色调为主,墙壁呈现出淡淡的橙黄色,地板上散布着金色的光斑。
技术参数设置
使用电影术语来指定技术参数,有助于精确地把控图像的视角与框架。“鸟瞰视角” 能够提供一种宏观的、俯瞰全局的视野,例如 “鸟瞰视角下的城市交通网络如脉络般纵横交错”,生成的图像会呈现出城市高楼大厦间道路的布局,车辆如蚂蚁般在道路上穿梭,展现出城市的繁忙与有序。
“特写” 可聚焦细节,如 “特写一颗古老的树桩上岁月留下的纹理”,图像会将树桩的纹理清晰地放大,展现出其历经风雨后的沧桑质感。
“摇臂镜头” 能营造出灵动且富有变化的视觉感受,比如 “摇臂镜头跟随滑板少年在街头巷尾穿梭”,画面会模拟摇臂拍摄的效果,随着滑板少年的移动,视角不断变化,街道两旁的建筑和人群快速掠过,给人一种身临其境的动感。
“广角镜头” 则可收纳更多的场景元素,例如 “广角镜头中的海边落日余晖洒在金色的沙滩上”,图像中广阔的沙滩、浩瀚的大海以及天边绚丽的落日都能被完整地呈现,营造出一种开阔而浪漫的氛围。
文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。
大模型创企MiniMax接近完成新一轮融资 估值有望达到近12亿美元
据路透社报道,有知情人士透露,专注于通用大型模型的中国人工智能创业公司MiniMax正接近完成一轮超过2.5亿美元的融资,其估值有望达到近12亿美元。该公司正在开发类似ChatGPT的人工智能解决方案。两名消息人士透露,MiniMax的最新一轮融资吸引了新的投资者,包括与腾讯有关联的实体。据悉,MiniMax先前的融资中还吸引到米哈游的参投。站长网2023-06-03 16:23:150000全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了
【新智元导读】最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风,简直让人一秒穿越回童年。就在最近,全公司都为这个大闹天宫MBTI测试炸了锅了。没想到啊,偌大一个公司居然隐藏着这么多i人?只见工位上的每个人都两眼放光,满怀期待地上传了自己的「美照」。站长网2024-07-04 18:11:060000一小时爆卖3万只,卖空上百吨!它在今年火出圈
今年中秋国庆假期,来自新疆的“冰川雪蟹”火了,成为不少长三角家庭餐桌上的网红时鲜。9月上旬,一则#新疆大螃蟹发货了#的微博热搜曾引发网友围观。据中新社,新疆阿勒泰地区,今年的第一批螃蟹被打捞上岸,送往浙江、上海等地,比阳澄湖等内地产区还要早上10天左右。站长网2023-10-06 09:57:510000联发科宣布与 OPPO ColorOS 合作 共建轻量化大模型端侧部署方案
据联发科技官方微博消息,MediaTek携手OPPO、ColorOS,合作共建轻量化大模型端侧部署方案,共同推动大模型能力在端侧逐步落地。图片来自@联发科技官方微博MediaTek先进的AI处理器APU与AI开发平台NeuroPilot,构建了完整的终端侧AI与生成式AI计算生态,可加速边缘AI计算的应用开发与落地,强化大语言模型和生成式AI应用的性能。站长网2023-10-11 17:35:540000Krea上线背景去除功能 简单拖拽即可自动抠图
Krea最新的更新带来了一项令人激动的功能:现在支持通过简单拖拽的方式将图片插入,而无需担心背景对生成画面的影响。这一创新性的功能使用户能够更灵活地编辑他们的内容,为创意提供了更广阔的空间。过去,许多用户可能会面临由于图片背景复杂而导致生成画面受到限制的问题。然而,Krea的最新更新解决了这个问题,为用户提供了一种简单而高效的方式来抠图,确保他们能够更好地掌控所生成内容的外观。站长网2023-11-22 10:23:090000