▌引言
自学 AI 却总卡在「提示词不会写」「生图总翻车」?
别慌!今天阿坚手把手拆解可灵 AI的文生图的操作,跟着官方文档抄作业,小白也能秒出大片!
内容超丰富,将分多期连载,第一弹先带大家吃透文生图核心玩法!
▌保姆级实操
4 月上线的可图 2.0 基座模型堪称降维打击!不仅能精准响应近百种风格,从电影质感大片到二次元萌系插画统统拿捏。
更重要的是 ——操作简单到离谱!只需四步,零基础也能一键出图: 输入提示词 → 上传参考图(可选)→ 选择尺寸数量→ 一键出图Step1:输入提示词
在【创意描述】中输入文本,支持中/英文输入。 如果暂时没有灵感,可以使用【推荐】中的示例提示词生成图片。

Step2:上传参考图(可选)
另外,在使用文本生成图片的过程中,可以通过上传【参考图/垫图】使用【垫图】功能。点击上传图片按钮,可以从本地或者平台历史生成结果中选取图片。
注意:平台目前仅支持JPG、PNG格式的文件,文件大小不超过10MB,尺寸不小于300px。

Step3:选择尺寸数量
可以灵活设置生成图片尺寸和数量。
注意:目前支持生成8种图片尺寸,一次最多可以生成9张图片。

Step4:一键出图
最后,点击【立即生成】就可以生成图片。

Step5:生成后编辑(可选)
生成图片后,还可以对结果进行垫图、局部重绘、扩图、画质增强等编辑。图片右上角还可以进行发布、收藏、下载、删除、举报操作。

Step6:生成视频(可选)
点击【生成视频】后,会跳转【图生视频】模块。图片结果会被作为首帧图来生成视频。具体操作请详见后续AI视频相关文章。


2.DeepSeek:点击DeepSeek按钮,直接发出你想要的主题,交给它来扩写润色提示词,点击【使用提示词】可直接用于生成;可以多轮对话让DeepSeek按要求修改,直到满意为止。

3.从图片获取:遇到喜欢的图,发送图片给DeepSeek直接获取到提示词,再修改或直接填入使用,生成图片。
▌提示词避坑经验1.一段提示词最核心的构成就是主体、主体行为和场景,用自然语言描述即可,此外,可以增加风格、光影、色彩等美学要求的词语。
-
主体:对主体外貌细节和姿态等的描述,可通过自然语言描述,如发型发色、服饰穿搭、五官形态、肢体姿态等;
-
主体行为:对主体行为姿态的描述,不宜过于复杂,定格某一个画面的行为动作即可;
-
场景:场景是主体所处的环境,包括前景、背景等;对主体所处环境的细节描述,如室内场景、室外场景、自然场景等。
-
美学补充:风格、光影、色彩、镜头语言、氛围等美学要求。
prompt:一个亚洲女生奔跑在傍晚的住宅区街道。

prompt:一个穿着校服的亚洲女生奔跑在傍晚的住宅区街道,右手提着便利店塑料袋,书包侧斜着,路边樱花盛开。

prompt:一个穿着校服的亚洲女生奔跑在傍晚的住宅区街道,右手提着便利店塑料袋,露出草莓牛奶包装,书包侧斜着,路边樱花盛开,日系青春电影质感,真人风格照片。

2.生图模型的效果像抽卡一样是不定概率的,如果一次不成功,可以多次调整prompt,抽多张图片,强调要求,逐渐抽到满意的图片。
3.想要电影质感的图片,记得强调“电影质感”、“电影氛围”等词。
4.重要的词放最前面,且模型响应不佳的词可反复强调,多次用近义词强调,例如下面示例对“毛毡”的反复强调。
prompt:一名宇航员站在月球表面,月球地面带着坑洼感。远处地球,宇航员的头盔是透明材质。宇航员身旁立着一面红色旗帜,整幅画面温暖、柔和且带着一种治愈的感觉,毛毡材质。

prompt:毛毡风格,一名全身穿着毛毡材质宇航服的宇航员站在毛毡质感的月球表面,月球地面是灰色的毛毡绒面,带着坑洼感。远处地球变成蓝色和绿色的毛毡拼接球,宇航员的头盔是透明材质,但边缘包裹着毛毡缝线。宇航员身旁立着一面毛毡材质的红色旗帜,整幅画面温暖、柔和且带着一种治愈的感觉。

5.如有明确使用场景,建议写出图片使用场景,例如“公众号配图、海报、背景、贴纸、Logo、纪实摄影”等
6.字数一般在几十字-300字为宜,有时用简洁的语言描述出的画面也会很惊艳!
prompt:古风男女初次相识,站在春天的花树下,花瓣飘落,4K高清。

prompt:一男子身着浅色系古装,发髻规整;一旁女子穿着淡色古风服饰,发型精致并佩戴着发饰。两人相对而立,女子掌心向上,目光专注看向男子,二人对视。他们身处户外,周围有开满白花的树木,花瓣悠悠飘落,背景中传统风格建筑若隐若现,整个画面氛围唯美,弥漫着古典浪漫的气息。

▌可灵2.0生图模型优势
1.语义遵循大幅提升:可图2.0对多种元素、复杂指令、颜色位置等响应有大幅度提升,画面细节真实感强。
2.电影质感提升:电影大片的氛围和层次,大场面和分镜照尽在可图!可图2.0画面的构图更有高级感,光影色彩为画面带来独特的美学调性。
3.支持风格拓展:可图2.0能支持近百种风格,从各类绘画技术、3D数字艺术、社交媒体爆火的效果,到各类影视风格质感。经典艺术风格不再只属于专业画师,每个人都能成为自己童话世界的造梦师!
4.其他优势:可图模型的画面残图率低,画面质量在业界领先;生图结果更具异质性,大幅提升创作者可用率。此外,1.5模型人像美感极佳。
prompt:一个充满氛围感的电影中近景镜头,戏仿《The Godfather》中 Don Vito Corleone 在他昏暗办公室里的经典场景。一只体型稍大的泰迪熊,穿着深色西装,威严地坐在一张迷你办公桌后面,爪子里可能抱着一只更小的毛绒玩具(模仿猫)。房间光线昏暗,运用强烈的明暗对比(chiaroscuro),营造出一种既有权力感、沉思感,又不失泰迪熊固有可爱的奇特融合。

prompt:摆满了白色桌子的宴会厅,周围坐着的人在享用一顿美餐。

prompt:一幅极简风格的等距3D插画,展示了一个安装在控制键盘上的、Q版“医师永真”造型的3D键帽。键盘采用温暖的浅棕色木纹外壳。此键帽严格控制在标准1u键位尺寸内。Q版永真的造型紧凑地设计在键帽基座上,身体和头部构成了键帽的主体和主要的按压区域。她捧着的葫芦或持握的刀柄等细节被巧妙地融入整体轮廓,避免过多向侧面伸出,其姿态和服饰细节在有限空间内被精心还原。柔和的光线突显其文静气质。整体在展现角色温柔可爱的同时,确保了键帽的实用性和安装兼容性。
