5
0

10个Prompt模板,让GPT Image 2精准出图

2026-05-04
10个Prompt模板,让GPT Image 2精准出图

AI 图像生成已经不是"输入一句话,看运气出图"的时代了。当你需要生成一个包含完整 UI 界面、精确中文排版、多层信息布局的复杂图像时,传统的自然语言 prompt 往往力不从心——要么丢元素,要么排版错乱,要么中文变乱码。

GPT Image 2 的出现,把 AI 出图的可控性拉到了一个全新的高度。而本文要分享的核心方法是:用结构化 prompt,精确控制 GPT Image 2 的每一个出图细节。

接下来,我会先介绍 GPT Image 2 的核心能力,再通过 10 个实操案例,展示如何用结构化prompt生成从游戏界面到电商详情页、从数据仪表盘到地产楼书的复杂场景图像。每个效果都已通过微软云Azure上的GPT Image 2服务验证。

GPT Image 2 核心能力

会思考的图像系统

GPT Image 2 不是简单的"文本→像素"转换器。它能根据上下文语义、草图参考、甚至实时搜索结果做出战略性的设计决策。你给它一段复杂的场景描述,它能理解元素之间的空间关系、层级关系和视觉逻辑,而不是机械地堆砌元素。

近乎完美的中文排版

这是 GPT Image 2 最让人惊艳的能力之一。中日韩等非拉丁语系的字符渲染准确率接近 99%。这意味着你可以放心地在生成图像中使用中文标题、中文按钮、中文数据标签,不再担心出现乱码、缺字或排版错位。

原生 4K 与自由长宽比

最高支持 4096×4096 分辨率输出,长宽比从 1:3 到 3:1 自由设定。无论是竖版手机界面(1024×1536)还是横版宽屏场景(1536×1024),都能原生输出,不需要后期拉伸或裁剪。

精细局部编辑

GPT Image 2 支持定点爆破级的局部编辑,指令遵循度极高。你可以指定修改图像中的某个区域,而不影响其他部分,这在迭代设计中非常实用。

GPT Image 2 vs 竞品对比

下表从 7 个维度对比了 GPT Image 2、GPT Image 1.5 和 Nano Banana Pro 的表现:

维度

GPT Image 2

GPT Image 1.5

Nano Banana Pro

胜出方

文字渲染

99%+ 近完美

较好

优秀

GPT Image 2

提示遵循

极强

良好

GPT Image 2

真实感

优秀

良好

极强

Nano Banana

复杂场景

100+ 元素

一般

GPT Image 2

编辑能力

精准多图编辑

不错

优秀

GPT Image 2

美学/审美

自然高级

一般

GPT Image 2

速度

更快

Nano Banana

结论很明确:在复杂场景的综合能力上,GPT Image 2 碾压级领先。尤其是在文字渲染、提示遵循和复杂场景处理这三个维度,它的优势几乎是断档式的。

用 JSON Prompt 精确控制出图

能力强是一回事,能不能精确控制是另一回事。

很多人用 AI 出图还停留在"写一段自然语言描述,然后抽卡看运气"的阶段。对于简单场景这没问题,但当你需要生成一个包含导航栏、侧边栏、数据图表、按钮组、文案区的完整 UI 界面时,自然语言的表达能力就严重不足了——你很难用一段话精确描述 20 个 UI 元素的位置、样式、内容和层级关系。

解决方案就是:用 JSON 格式的结构化 prompt

JSON prompt 的核心优势:

  • 层级清晰

    :通过嵌套结构精确描述元素的父子关系和空间布局

  • 语义明确

    :每个字段都有明确含义,不存在自然语言的歧义

  • 元素完整

    :可以逐一列举每个 UI 组件的内容、样式、位置

  • 可复用

    :修改某个字段就能快速迭代,不需要重写整段描述

下面通过 10 个实操案例,展示 JSON prompt 的实际效果。所有案例均使用 Azure GPT Image 2 API 生成。

案例 1:三国策略游戏界面

一个包含资源面板、部队列表、战场地图、指令栏的完整 RTS 游戏界面,以赤壁之战为场景。

{  "type": "策略游戏(RTS)界面截图",  "game": "天下三分 — 三国即时战略游戏",  "style": "写实古风,铜器质感UI边框,竹简纹理面板,水墨地图底纹",  "scene_background": "俯视45°角战场:长江赤壁段,南岸曹军大营密布帐篷和攻城器械,江面上数十艘战船排列,北岸远处是孙刘联军的火船编队,天空阴云密布,远处有火光",  "ui_elements": {    "top_left": {      "faction_panel": "势力:蜀汉 刘备 | 年份:建安十三年(208)",      "resources": "粮草 82,400 ⬆ | 金 15,700 | 铁矿 3,200 | 人口 124,000/150,000",      "resource_style": "铜钱/稻穗/矿石小图标 + 数值"    },    "top_center": {      "event_banner": "⚔️ 赤壁之战 — 第3回合 | 东南风将起(2回合后)",      "turn_timer": "本回合剩余:02:35"    },    "top_right": {      "minimap": "方形战略小地图,显示长江走向,红色=曹魏,蓝色=蜀汉,绿色=东吴",      "fog_of_war": "曹军北岸大部分被战争迷雾覆盖",      "zoom_controls": "放大/缩小按钮"    },    "left_panel": {      "title": "部队列表",      "units": [        "🏹 诸葛亮·军师团 — 2,000人 | 士气95 | 火计就绪",        "⚔️ 赵云·虎威营 — 5,000骑兵 | 士气88 | 待命",        "🛡️ 张飞·先锋军 — 8,000步兵 | 士气92 | 驻守",        "🚢 黄盖·火船队 — 20艘 | 满载火油 | 待命出击"      ],      "style": "竹简卷轴样式列表,每行带小头像"    },    "bottom_center": {      "command_bar": "8个指令按钮",      "commands": ["移动", "攻击", "驻守", "火攻", "伏兵", "撤退", "外交", "计谋"],      "style": "铜质方形按钮,带篆书标签,'火攻'按钮高亮发光"    },    "bottom_right": {      "tech_tree_preview": "当前研究:连环计(进度 78%)| 下一个:东风借箭",      "advisor_tip": "军师提示:'东南风将至,可令黄盖诈降,以火船破曹军连环战船。'"    },    "center_selection": {      "selected_unit": "黄盖·火船队",      "info_popup": "半透明面板:攻击力 85 | 防御 20 | 速度 70 | 特殊技能:诈降火攻(消耗全部火船,对敌舰队造成毁灭性伤害)",      "action_radius": "以选中单位为中心的移动范围圆圈(青色虚线)"    }  }}

这个 JSON prompt 通过 ui_elements 的嵌套结构,精确控制了游戏界面中每个面板的位置(top_left、top_center、bottom_center 等)、内容和视觉风格。从资源数值到部队属性,从指令按钮到军师提示,所有元素都被明确定义。生成结果在复杂元素的空间布局和中文渲染上表现出色。

案例 2:导航界面

一个夜间驾车穿越上海陆家嘴的手机导航界面,包含 3D 建筑物、路线规划、弹窗提示等多层信息。

{  "type": "手机导航App界面截图",  "app": "高德地图风格实时导航",  "style": "深色模式地图,3D建筑物渲染,霓虹路线高亮,iOS风格UI",  "device": "iPhone全面屏,带灵动岛和状态栏(信号+WiFi+电量78%+时间21:47)",  "scene": "夜间驾车导航穿越上海陆家嘴",  "ui_elements": {    "top_bar": {      "next_turn": {        "icon": "右转箭头(大号,绿色)",        "distance": "300米后右转",        "road_name": "进入世纪大道",        "lane_guidance": "4车道图示,最右2车道高亮(推荐车道)"      }    },    "map_view": {      "perspective": "3D驾驶视角,前方道路延伸",      "route_line": "蓝绿色渐变导航线,当前位置有脉冲动画箭头",      "buildings_3d": "陆家嘴三件套(上海中心、环球金融、金茂大厦)半透明3D轮廓,带楼层灯光",      "traffic_overlay": "当前路段绿色(畅通),前方500米有一段黄色(缓行)",      "poi_markers": ["星巴克(咖啡杯图标)", "国金中心(购物袋图标)", "东方明珠(地标图标)"],      "car_icon": "蓝色三角箭头表示当前位置和朝向"    },    "bottom_info_bar": {      "eta": "预计到达 22:15",      "remaining": "剩余 12.3公里 · 约28分钟",      "traffic_status": "前方整体畅通",      "speed": "当前速度 52 km/h(限速60)"    },    "bottom_controls": {      "left": "路线概览按钮",      "center": "收起/展开按钮",      "right": "更多选项(加油站·休息区·分享位置)"    },    "floating_elements": {      "top_right": "3D/2D切换 + 指南针",      "music_widget": "迷你音乐播放条:🎵 周杰伦 - 夜曲 ▶️",      "speed_camera_alert": "前方800米测速摄像头(限速60km/h)⚠️"    }  }}

导航界面是信息密度极高的 UI 场景——转向指示、车道引导、3D 建筑、路况叠加、POI 标注、速度信息同时呈现。JSON prompt 通过 map_viewbottom_info_barfloating_elements 等字段,将每一层信息分门别类地描述清楚,GPT Image 2 据此生成了一张层次分明的导航截图。

案例 3:B站弹幕视频截图

一个完整的 B 站视频播放页面,包含弹幕层、进度条、控制栏、右侧推荐列表等全部 UI 元素。

{  "type": "B站视频播放截图",  "style": "B站(Bilibili)播放器UI,深色模式,16:9视频画面",  "scene": "视频画面内容:一个年轻男主播坐在RGB灯光桌前,面前有3块显示器,正在做'2026年最强显卡天梯排行'的科技评测视频,主屏显示GPU性能对比柱状图",  "ui_elements": {    "video_area": {      "danmaku_layer": {        "density": "中等密度弹幕,约30条同时在屏",        "scrolling_danmaku": [          "这个UP主讲的真好",          "N卡yes!A卡也不错",          "等等党永远不亏",          "前排膜拜大佬",          "4090Ti真的有必要吗?",          "钱包在哭泣",          "已三连!",          "打游戏够用就行",          "矿卡:你们叫我?",          "6年前的1080还在战斗",          "DLSS太强了吧",          "建议直接买最贵的(手动狗头)",          "光追才是未来",          "A卡驱动修好了吗",          "性价比之王 7800XT"        ],        "top_danmaku": "【置顶】UP主:本期所有显卡均为自费购买,无商业合作",        "colored_danmaku": "2-3条彩色弹幕(蓝色、橙色),其余白色",        "style": "微软雅黑,带1px黑色描边,半透明"      }    },    "progress_bar": {      "current": "08:42",      "total": "23:15",      "progress": "约37%位置",      "preview_thumbnail": "鼠标悬停处显示小预览图",      "hot_spots": "进度条上有几个高亮峰值(热门时刻)"    },    "control_bar": {      "left": "播放/暂停 | 下一P | 音量(68%)| 倍速(1.5x)",      "center": "弹幕开关(已开启)| 弹幕设置齿轮 | 弹幕输入框'发个弹幕见证当下~'",      "right": "画质(4K) | 宽屏 | 网页全屏 | 全屏"    },    "right_sidebar": {      "video_info": {        "title": "【年度巨制】2026显卡天梯图!从RTX 5090到亮机卡,43张显卡全测一遍",        "up_info": "UP主:硬件茶谈 | 粉丝 328万 | 已关注",        "stats": "▶️ 487万播放 · 📝 2.1万弹幕 · 2026-04-20",        "interaction": "👍 18.7万 · 💰 3.2万 · ⭐ 12.4万 · 🔄 4.6万"      },      "playlist": {        "title": "相关推荐",        "items": [          "CPU天梯图2026 — 硬件茶谈 · 312万播放",          "装机不求人完全指南 — 翼王 · 267万播放",          "5090 vs 7900XTX实测 — 极客湾 · 198万播放"        ]      }    }  }}
65a123bffd748c96a8b5190f6459a44c.jpg

B 站播放页是中文互联网最具特色的 UI 之一——弹幕层就包含了 15 条不同内容的滚动文字。JSON prompt 通过数组逐条定义弹幕内容,通过嵌套对象分别描述进度条、控制栏、右侧边栏的结构。这种精细度是自然语言 prompt 很难达到的。

案例 4:爆炸图海报

一张专业级产品爆炸视图海报,展示无人机的 8 层核心组件和详细技术参数标注。

{  "type": "产品爆炸视图海报",  "subject": "专业航拍无人机",  "style": "高科技3D渲染,暗色主题,青蓝色光效点缀,工业精密感",  "background": "深灰到纯黑径向渐变,微粒光点",  "header": {    "logo": "▲ SKYEYE FALCON X7",    "subtitle": "每一个模块,为极致飞行而生"  },  "layout": {    "centerpiece": "无人机垂直堆叠爆炸视图,展示8层组件:碳纤维机臂(4个)、无刷电机组、螺旋桨叶片、云台稳定器、4K HDR摄像头模组、飞控主板(含GPS+避障芯片)、智能电池组、机身上壳(带散热鳍片)",    "callout_labels": {      "left_side": [        "碳纤维折叠机臂\n航空级T700碳布,重量仅42g/臂,折叠后体积缩小60%",        "飞控核心主板\n双冗余IMU + RTK厘米级定位 + 全向避障处理单元",        "智能飞行电池\n5870mAh LiPo 4S,续航47分钟,支持PD快充",        "散热机身上壳\n航空铝合金+石墨烯散热片,长时间飞行不过热"      ],      "right_side": [        "2212无刷电机 ×4\n最大推力1.2kg/个,KV值920,静音设计",        "碳纤螺旋桨\n9寸低噪桨叶,快拆设计,3秒更换",        "三轴云台稳定器\n±0.01°控制精度,支持竖拍模式切换",        "1英寸CMOS摄像头\nHasselblad调色,4K/120fps + 20MP照片"      ]    },    "footer": {      "left_text": {        "headline": "精密堆叠,定义专业航拍",        "body": "8大核心模块经过10万次飞行测试验证。SKYEYE FALCON X7,从结构设计到飞控算法,每一层都是行业标杆。"      },      "right_logo": "▲ SKYEYE"    }  }}

爆炸视图是产品展示中信息密度最高的形式之一。这个 JSON prompt 通过 callout_labels 的左右分栏,精确控制了 8 个组件标注的位置和内容,每个标注都包含组件名称和技术参数。GPT Image 2 成功渲染了多层堆叠结构和密集的中文标注。

案例 5:信息图

一张包含市场规模、头部玩家、细分赛道、关键趋势的 2026 年全球 AI 行业全景信息图。

{  "type": "信息图表海报",  "subject": "2026年全球AI行业全景图",  "style": "扁平化矢量风格,深蓝背景,渐变霓虹色数据高亮,科技感",  "background": "深蓝 #0A1628,底部有浅色网格线",  "layout": {    "header": {      "title": "2026 全球AI行业全景图",      "english": "GLOBAL AI LANDSCAPE 2026",      "subtitle": "数据来源:IDC / Gartner / CB Insights"    },    "section_1_market": {      "title": "市场规模",      "main_number": "$5,200亿",      "sub_text": "全球AI市场规模(2026年预估)",      "growth_chart": "2020-2026柱状图,逐年递增,2026高亮",      "yoy": "同比增长 38.7%"    },    "section_2_players": {      "title": "头部玩家",      "layout": "6个圆形Logo排列",      "companies": [        {"name": "OpenAI", "valuation": "$3000亿", "focus": "大模型"},        {"name": "Google DeepMind", "valuation": "-", "focus": "AGI研究"},        {"name": "Anthropic", "valuation": "$610亿", "focus": "安全AI"},        {"name": "Meta AI", "valuation": "-", "focus": "开源模型"},        {"name": "xAI", "valuation": "$500亿", "focus": "Grok"},        {"name": "字节跳动", "valuation": "-", "focus": "豆包/多模态"}      ]    },    "section_3_segments": {      "title": "细分赛道",      "pie_chart": {        "segments": [          "大模型/基础设施 35%",          "企业AI应用 25%",          "自动驾驶 15%",          "AI芯片 12%",          "AI安全 8%",          "其他 5%"        ]      }    },    "section_4_trends": {      "title": "2026关键趋势",      "items": [        {"icon": "🤖", "text": "Agent成为主流交互范式"},        {"icon": "🧠", "text": "多模态模型统一文本/图像/视频/代码"},        {"icon": "⚡", "text": "端侧AI芯片性能突破100TOPS"},        {"icon": "🔒", "text": "AI安全监管全球立法加速"}      ]    },    "footer": "© 2026 AI Research Report | 数据截至2026年4月"  }}

信息图是典型的"高密度、多区块"场景。JSON prompt 通过 section_1 到 section_4 的分区结构,清晰定义了市场数据、玩家矩阵、饼图和趋势列表四大模块的内容。GPT Image 2 在数字渲染和中英文混排方面的表现尤为突出。

案例 6:产品落地页设计

一个完整的 SaaS 产品落地页,包含导航栏、Hero 区域、功能卡片和客户 Logo 栏。

{  "type": "Web UI 落地页设计",  "product": "FlowDesk — AI驱动的项目管理平台",  "style": "现代SaaS风格,浅色模式,大圆角,柔和阴影,紫蓝渐变作为品牌色",  "device": "在MacBook Pro屏幕中展示,笔记本电脑45°倾斜视角",  "page_layout": {    "nav_bar": {      "left": "FlowDesk Logo(抽象流水图标+文字)",      "center": ["产品", "价格", "文档", "博客"],      "right": "登录 | 免费试用(紫色实心按钮)"    },    "hero_section": {      "headline": "用AI重新定义项目管理",      "sub_headline": "FlowDesk 自动拆解任务、预测延期风险、生成周报,让团队专注于真正重要的事。",      "cta_buttons": ["免费开始(紫色)", "观看演示(白色描边)"],      "hero_image": "右侧浮动展示产品截图:看板视图,有多个彩色任务卡片,AI助手对话气泡覆盖在上方",      "social_proof": "已有 12,000+ 团队在使用 · ⭐4.9 Product Hunt"    },    "features_section": {      "title": "为什么选择 FlowDesk?",      "cards": [        {"icon": "🧠", "title": "AI 任务拆解", "desc": "描述目标,AI自动生成子任务和里程碑"},        {"icon": "⚠️", "title": "风险预警", "desc": "实时分析进度数据,提前48小时预测延期"},        {"icon": "📊", "title": "一键周报", "desc": "AI汇总本周进展,自动生成图文报告"}      ]    },    "logo_bar": "信任我们的团队:字节跳动 · 蚂蚁集团 · 小红书 · 理想汽车 · 米哈游"  }}

SaaS 落地页需要精确的视觉层级——导航栏、Hero 区域、功能卡片、社会证明、Logo 栏各司其职。JSON prompt 通过 page_layout 的嵌套结构把每个区块的内容和样式定义得清清楚楚。生成结果的整体排版和品牌一致性都很到位。

案例 7:游戏界面

一个仙侠风 MMORPG 的完整游戏截图,包含血条、技能栏、任务追踪、聊天框、小地图等全套 UI 元素。

{  "type": "游戏UI界面截图",  "game": "仙剑奇缘Online — 国风MMORPG",  "style": "中国仙侠风,金色描边UI框架,半透明深色面板,粒子特效点缀",  "scene_background": "云海之上的仙山宫殿,远处有飞瀑和仙鹤,黄昏光照,体积云",  "ui_elements": {    "top_left": {      "player_info": "头像框(金色龙纹边框)+ 角色名'青莲剑仙' + Lv.87 + 门派'蜀山'",      "hp_bar": "红色血条 12,450/15,000",      "mp_bar": "蓝色法力条 8,200/10,000",      "buffs": "3个增益图标(剑气护体、灵力加持、经验翻倍)"    },    "top_center": {      "quest_tracker": "当前任务:寻找上古灵剑 (3/5) — 击败蛟龙守卫 ✓ · 收集龙鳞 ✓ · 解开封印阵 ✓ · 进入剑冢 ○ · 取得灵剑 ○"    },    "top_right": {      "minimap": "圆形小地图,显示周围地形、NPC黄点、队友绿点、怪物红点",      "coordinates": "蜀山·剑冢秘境 (1247, 892)"    },    "bottom_center": {      "skill_bar": "12个技能格,带快捷键1-0和Q/E标注",      "skills": [        "御剑术", "万剑归宗", "冰封千里", "回春术",        "雷电斩", "分身幻影", "龙吟", "天罡剑阵",        "疾风步", "灵盾", "大招·诛仙剑阵(CD 12s)", "坐骑召唤"      ],      "action_bar_style": "金色描边菱形图标,激活技能有蓝色光效"    },    "bottom_left": {      "chat_box": "半透明聊天框",      "messages": [        "【世界】云中君:有人组队打蛟龙吗?",        "【队伍】花千骨:我来奶,等我传送",        "【系统】恭喜玩家'剑圣无双'获得神器·轩辕剑!"      ]    },    "bottom_right": {      "quick_access": "背包 · 角色 · 社交 · 商城 · 系统",      "mount_button": "骑乘按钮(仙鹤图标)"    },    "center": {      "character": "一位白衣飘飘的剑修角色站在画面中央,手持发光长剑,衣袂飘动,脚下有法阵光效"    }  }}

MORPG 界面是 UI 复杂度的天花板——血条、法力条、12 个技能格、任务追踪、聊天频道、小地图、快捷栏同时出现在一个画面中。JSON prompt 通过空间位置字段(top_left、bottom_center 等)精确编排了每个面板的位置,GPT Image 2 的渲染结果忠实地还原了这个复杂布局。

案例 8:电商产品详情页

一个天猫风格的手机端产品详情页,包含轮播图、价格区、SKU 选择器、特性图标和底部操作栏。

{  "type": "手机端电商产品详情页",  "platform": "天猫旗舰店风格",  "product": "戴森 Airwrap 多功能美发造型器",  "style": "高端产品详情页,白色背景为主,品牌紫红色点缀,精致产品摄影",  "device": "iPhone手机屏幕内展示,带状态栏",  "page_layout": {    "top_bar": "天猫 · 戴森官方旗舰店 | 关注 | 客服",    "hero_carousel": {      "main_image": "戴森Airwrap产品45°侧视图,紫红配色,悬浮感,周围有飘动的发丝展示气流效果",      "indicators": "5个圆点,第1个高亮",      "tag": "左上角红色标签'新品首发'"    },    "price_section": {      "title": "Dyson Airwrap i.d.™ 多功能造型器 长发版",      "price": "¥3,999",      "original_price": "¥4,599(划线价)",      "promotion": "限时直降600 | 赠价值299元顺滑精油",      "sales": "月销 8,200+",      "rating": "4.9分 · 2.1万+评价"    },    "sku_selector": {      "color_options": ["紫红色(当前选中,带边框)", "深空灰", "柔粉色"],      "spec_options": ["长发版 ¥3,999", "短发版 ¥3,799", "完整版 ¥4,699"]    },    "key_features": {      "layout": "4个圆形icon横排",      "items": [        {"icon": "💨", "text": "康达效应气流"},        {"icon": "🌡️", "text": "智能温控"},        {"icon": "✨", "text": "防飞翘"},        {"icon": "🔄", "text": "多合一造型"}      ]    },    "detail_images": "下方开始是产品详情长图区域,展示第一张:模特使用Airwrap卷发的效果图,左侧文案'一次吹干,同时造型'",    "bottom_bar": {      "left": "店铺 | 客服 | 购物车(3)",      "right": "加入购物车(金色)| 立即购买(红色)"    }  }}

电商详情页的信息层级非常复杂:轮播图→价格促销→SKU 选择→特性展示→详情图→底部操作栏,每一层都有独立的视觉逻辑。JSON prompt 通过 page_layout 的有序嵌套,让 GPT Image 2 生成了一张结构完整、信息准确的竖版电商页面。

案例 9:数据分析仪表盘

一个企业级电商运营数据中台界面,包含 KPI 卡片、双轴图表、环形图、条形图和热力地图。

{  "type": "企业级数据分析仪表盘",  "product": "PRISM Analytics — 电商运营数据中台",  "style": "深色模式,玻璃拟态卡片(glassmorphism),渐变紫蓝高亮,16px圆角",  "background": "#0B0F1A 深蓝黑",  "layout": {    "sidebar": {      "width": "窄侧边栏",      "logo": "◇ PRISM",      "nav_items": [        "📊 概览(当前高亮)", "📈 销售", "👥 用户",        "📦 商品", "🎯 营销", "⚙️ 设置"      ],      "bottom": "用户头像 'JW' + 在线状态绿点"    },    "top_bar": {      "left": "概览 Overview",      "center": "日期选择器:2026-04-01 至 2026-04-24",      "right": "刷新 | 导出 | 筛选器"    },    "kpi_cards": {      "count": 4,      "cards": [        {"title": "总GMV", "value": "¥12,847,300", "change": "+18.5%↑", "color": "绿色", "sparkline": "上升趋势"},        {"title": "订单量", "value": "38,729", "change": "+12.3%↑", "color": "绿色", "sparkline": "上升趋势"},        {"title": "客单价", "value": "¥331.7", "change": "-2.1%↓", "color": "红色", "sparkline": "微降趋势"},        {"title": "退货率", "value": "4.2%", "change": "-0.8%↓", "color": "绿色", "sparkline": "下降趋势(好)"}      ]    },    "main_chart": {      "title": "GMV与订单量趋势(近30天)",      "type": "双轴组合图:柱状图(GMV,渐变紫色)+ 折线图(订单量,青色)",      "x_axis": "日期 4/1 - 4/24",      "annotations": "4月18日标注'大促日'峰值"    },    "bottom_left": {      "title": "品类销售占比",      "type": "环形图",      "data": [        "服装 32%(紫色)", "数码 24%(蓝色)", "美妆 18%(粉色)",        "食品 15%(绿色)", "家居 11%(橙色)"      ],      "center_text": "¥12.8M"    },    "bottom_center": {      "title": "热销商品 Top 5",      "type": "横向条形图",      "items": [        "iPhone 16 Pro — ¥1,247,000",        "Airwrap 造型器 — ¥892,000",        "始祖鸟冲锋衣 — ¥763,000",        "SK-II神仙水 — ¥651,000",        "戴森V15吸尘器 — ¥589,000"      ]    },    "bottom_right": {      "title": "实时流量地图",      "type": "中国地图热力图",      "hotspots": "广东、浙江、江苏颜色最深,标注各省GMV数值"    }  }}

数据仪表盘是 JSON prompt 最能发挥优势的场景之一。4 张 KPI 卡片的数值、涨跌方向、颜色编码,主图表的双轴类型,底部三个子图表的数据内容——所有这些都通过 JSON 的结构化字段精确传达。生成结果中的数值、图表类型和布局高度还原了 prompt 的描述。

案例 10:地产楼书

一本超高端地产画册的对开页设计,左页深墨绿底配建筑渲染图,右页纯白底配楼盘信息。

{  "type": "超高端地产楼书对开页",  "project": "湖山雅集 LAKEVIEW MANOR",  "style": "顶奢地产画册,大面积留白,烫金细节,宋体+无衬线英文混排,极致优雅",  "background": "左页深墨绿色,右页纯白",  "layout": {    "left_page": {      "background": "深墨绿色 #1A2F2A",      "content": {        "top_left": "烫金小字 'LAKEVIEW MANOR · PRIVATE COLLECTION'",        "center": {          "type": "建筑可视化渲染图",          "description": "湖畔独栋别墅黄昏全景:三层现代中式建筑,大面积落地窗映射暖黄室内光,前方无边际泳池与湖面视觉连接,远山层叠,天空是粉橙渐变的晚霞。庭院有日式枯山水,几株造型松点缀。"        },        "bottom": "白色小字 '实景拍摄于2026年3月 · 湖山雅集C-12号院'"      }    },    "right_page": {      "background": "纯白",      "content": {        "top": {          "chinese_title": "湖山雅集",          "english_title": "LAKEVIEW MANOR",          "divider": "细金线"        },        "body_text": "择址千岛湖黄金半岛,三面环湖,一面依山。\n\n每一座院落都是一件孤品——\n270°环湖视野,私家泊位直通湖面,\n室内面积约480-680㎡,庭院面积约300-500㎡。\n\n由安藤忠雄工作室担纲建筑设计,\n以清水混凝土与原木诠释东方侘寂之美。",        "specs_grid": {          "layout": "2x3网格,每格一个参数",          "items": [            {"icon": "🏔️", "value": "三面环湖", "label": "270°湖景"},            {"icon": "🏊", "value": "无边际泳池", "label": "湖面视觉连接"},            {"icon": "📐", "value": "480-680㎡", "label": "室内面积"},            {"icon": "🌿", "value": "300-500㎡", "label": "私家庭院"},            {"icon": "🛥️", "value": "私家泊位", "label": "直通湖面"},            {"icon": "🏗️", "value": "安藤忠雄", "label": "建筑设计"}          ]        },        "cta": {          "text": "私人品鉴预约",          "phone": "400-000-8888",          "note": "仅限邀约制参观"        },        "bottom_logos": "千岛湖旅游集团 × 绿城中国 × 安藤忠雄建筑研究所"      }    }  }}

地产楼书的设计语言与前面的科技类 UI 完全不同——强调留白、烫金、中英文混排的极致优雅。JSON prompt 通过 left_page 和 right_page 的对称结构,分别定义了渲染图页和信息页的内容。GPT Image 2 在字体风格、色彩控制和排版美感上的表现令人满意。

总结

通过以上 10 个实操案例,可以清楚地看到 JSON prompt 在精确控制 AI 出图方面的核心优势:

1. 结构即布局:JSON 的层级嵌套天然对应 UI 的空间层级,top_leftbottom_center 这样的字段名直接告诉模型元素该放在哪里

2. 细节不丢失:数组和对象可以逐一枚举每个元素的内容、样式、参数,不会像自然语言那样在长描述中遗漏细节

3. 可迭代可复用:修改某个字段就能快速调整,不需要重写整段 prompt

4. 语义无歧义:字段名+值的组合比自然语言更精确,模型理解偏差更小

JSON prompt 不是万能的——简单场景用自然语言描述反而更高效。但当你面对复杂 UI 界面、多元素信息图、精密产品展示这类场景时,JSON prompt + GPT Image 2 的组合能给你远超"抽卡"的确定性和可控性。

评论