AI 图像生成入门:用 API 调用 DALL·E / Flux 创建图片

想用一句话生成一张精美图片?AI 图像生成技术已经能做到这一点。通过词元圈 API,你可以调用 DALL·E 3、Flux 等主流图像模型,把文字描述变成高质量图片。本文将手把手教你从零开始使用图像生成 API。
什么是 AI 图像生成
AI 图像生成(Text-to-Image)是一种根据文字描述自动生成图片的技术。你只需要用自然语言描述想要的画面,AI 就能在几秒钟内生成对应的图片。
这项技术的核心原理:
- 文字理解:AI 解析你的描述,提取关键信息(主体、风格、构图等)
- 图像合成:基于理解的内容,从噪声中逐步「还原」出一张完整的图片
- 质量优化:经过多轮迭代,生成细节丰富、视觉效果出色的成品

选择合适的模型
词元圈提供多种图像生成模型,各有特点:

选择建议:
- 新手入门:先用 DALL·E 3,效果稳定,Prompt 容错率高
- 追求性价比:Flux 生成速度快、价格低,适合批量使用
- 特定风格:Flux 在动漫、插画风格上表现更出色
- 需要文字:DALL·E 3 在图片中渲染文字的能力更强
详细操作步骤
第一步:获取 API 密钥
登录词元圈后台,进入「API 密钥」页面:
- 点击「创建密钥」按钮
- 输入密钥名称(如「图像生成测试」)
- 复制生成的密钥,格式为
sk-relay-xxxxxxxxxx
安全提醒:密钥只显示一次,请妥善保存。建议将密钥存放在环境变量中,不要硬编码在代码里。
第二步:用 curl 发送请求
打开终端,执行以下命令生成一张图片:
curl -X POST https://www.ciyuano.com/v1/images/generations -H "Authorization: Bearer sk-relay-你的密钥" -H "Content-Type: application/json" -d '{
"model": "dall-e-3",
"prompt": "a cute cat sitting on a windowsill, watching sunset, watercolor style",
"n": 1,
"size": "1024x1024"
}'
参数说明:
| 参数 | 说明 | 可选值 |
|---|---|---|
model |
使用的模型 | dall-e-3, flux |
prompt |
图片描述(英文效果更好) | 任意文字描述 |
n |
生成图片数量 | 1-4 |
size |
图片尺寸 | 1024x1024, 1792x1024, 1024x1792 |
执行成功后,API 会返回一个 JSON 响应,其中包含生成图片的 URL。在浏览器中打开该 URL 即可查看和下载图片。
第三步:用 Python 调用
如果你更习惯用代码调用,Python 是最简单的方式:
import requests
import json
url = "https://www.ciyuano.com/v1/images/generations"
headers = {
"Authorization": "Bearer sk-relay-你的密钥",
"Content-Type": "application/json"
}
data = {
"model": "dall-e-3",
"prompt": "a cozy coffee shop interior, warm lighting, illustration style",
"n": 1,
"size": "1024x1024"
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
# 获取图片 URL
image_url = result["data"][0]["url"]
print(f"图片已生成: {image_url}")
# 下载图片到本地
img_response = requests.get(image_url)
with open("generated.png", "wb") as f:
f.write(img_response.content)
print("图片已保存: generated.png")
第四步:优化你的 Prompt
Prompt 的质量直接决定生成图片的效果。以下是写好 Prompt 的几个要点:
好 Prompt 的结构
[主体] + [场景] + [风格] + [光线] + [构图] + [色调]
对比示例:
| Prompt | 效果 |
|---|---|
| "cat" | 随机猫咪图片,质量不可控 |
| "a fluffy orange tabby cat sitting on a wooden windowsill, golden hour sunlight, soft focus background, warm tones, cozy atmosphere" | 细节丰富、构图精致的猫咪图片 |
Prompt 写作技巧
1. 用英文写 Prompt
目前主流图像模型对英文的理解能力更强。如果需要中文内容的图片,可以先用中文构思,再翻译成英文。
2. 指定艺术风格
常用风格关键词:
- 写实类:photorealistic, cinematic, 8k, detailed
- 插画类:illustration, watercolor, oil painting, digital art
- 动漫类:anime style, manga, Studio Ghibli style
- 设计类:flat design, minimalist, geometric, poster
3. 描述光线和氛围
光线对图片效果影响很大:
golden hour— 温暖的日落光线soft diffused light— 柔和的漫射光dramatic lighting— 戏剧性光影neon lights— 霓虹灯光
4. 控制画面构图
close-up— 特写wide angle— 广角bird's eye view— 俯瞰symmetrical— 对称构图
批量生成图片
如果你需要批量生成图片,可以用一个简单的 Python 脚本来实现:
import requests
import time
prompts = [
"a modern office desk with laptop, minimalist style",
"a tropical beach at sunset, vibrant colors",
"a futuristic city skyline at night, cyberpunk style",
"a cozy reading nook with books, warm lighting"
]
for i, prompt in enumerate(prompts):
response = requests.post(
"https://www.ciyuano.com/v1/images/generations",
headers={"Authorization": "Bearer sk-relay-你的密钥"},
json={"model": "flux", "prompt": prompt, "n": 1, "size": "1024x1024"}
)
url = response.json()["data"][0]["url"]
img = requests.get(url)
with open(f"image_{i+1}.png", "wb") as f:
f.write(img.content)
print(f"[{i+1}/4] 已生成: image_{i+1}.png")
time.sleep(2) # 控制请求频率
实用场景
自媒体配图
为文章、社交媒体帖子生成专属配图,比使用素材库图片更有辨识度,也不存在版权问题。
产品原型设计
在产品设计初期,用 AI 生成概念图和原型图,快速验证设计方向,节省设计师沟通成本。
电商商品图
生成商品展示图、场景图,或者为已有商品图更换背景,提升商品页面的视觉效果。
教育培训素材
为课件、培训材料生成插图和示意图,让内容更加生动易懂。
常见问题
| 问题 | 解决方案 |
|---|---|
| 生成的图片和描述不符 | 优化 Prompt,增加更多细节描述 |
| 返回 429 错误 | 请求过于频繁,增加请求间隔或升级套餐 |
| 图片中文字变形 | 尝试用 DALL·E 3 模型,文字渲染效果更好 |
| 生成速度慢 | Flux 比 DALL·E 3 更快;降低图片分辨率 |
| 费用超出预期 | 用 Flux 模型替代,价格更低;控制生成数量 |
总结
通过词元圈的图像生成 API,你可以用一句话生成高质量图片。整个流程只需要三步:
- 获取 API 密钥
- 发送一个 HTTP POST 请求,附上图片描述
- 获取生成的图片 URL,下载使用
核心建议:
- 写好 Prompt 是关键,越详细效果越好
- 根据需求选择合适的模型
- 批量生成时注意控制请求频率
- 英文 Prompt 通常比中文效果更好
下一步:尝试用不同的 Prompt 和模型生成同一主题的图片,对比效果差异。然后将图像生成功能集成到你的应用中,为用户创造更丰富的视觉体验。
📖 相关文章
💬 评论功能暂未开放,敬请期待