Requirements
- Target platform
- OpenClaw
- Install method
- Manual import
- Extraction
- Extract archive
- Prerequisites
- OpenClaw
- Primary doc
- SKILL.md
图像生成辅助。支持通过 OpenRouter 直接调用各种生图模型(如 Seedream),为 OpenClaw 优化,支持提示词、尺寸等参数配置。目前仅限 OpenRouter provider。
图像生成辅助。支持通过 OpenRouter 直接调用各种生图模型(如 Seedream),为 OpenClaw 优化,支持提示词、尺寸等参数配置。目前仅限 OpenRouter provider。
Hand the extracted package to your coding agent with a concrete install brief instead of figuring it out manually.
I downloaded a skill package from Yavira. Read SKILL.md from the extracted folder and install it by following the included instructions. Tell me what you changed and call out any manual steps you could not complete.
I downloaded an updated skill package from Yavira. Read SKILL.md from the extracted folder, compare it with my current installation, and upgrade it while preserving any custom configuration unless the package docs explicitly say otherwise. Summarize what changed and any follow-up checks I should run.
为 OpenClaw 提供原生的图像生成能力,通过文字描述词快速生成高质量图像。
用户提示词 (Prompt) ↓ ┌─────────────────────────────────────┐ │ 识别参数:模型、尺寸、比例、路径 │ └─────────────────────────────────────┘ ↓ ┌─────────────────────────────────────┐ │ 调用 OpenRouter 接口 (OpenClaw) │ └─────────────────────────────────────┘ ↓ ┌─────────────────────────────────────┐ │ 默认模型:seedream-4.5 (Text-to-Image) & Gemini 2.5 (Image-to-Image) │ └─────────────────────────────────────┘ ↓ ┌─────────────────────────────────────┐ │ 原子化写入本地存储 (Safety First) │ └─────────────────────────────────────┘ ↓ 返回结构化 JSON (Success Payload)
本技能需要 OpenRouter API Key 才能调用图像生成服务。 访问 OpenRouter 控制台 创建 API Key 请根据下方指引手动配置环境变量
根据 OpenClaw 官方最佳实践,请通过 ~/.openclaw/openclaw.json 配置环境变量: { skills: { entries: { "image-generation": { enabled: true, env: { OPENROUTER_API_KEY: "sk-or-v1-xxxxxxxx..." } } } } } 或使用 primaryEnv 快捷配置: { skills: { entries: { "image-generation": { enabled: true, apiKey: "sk-or-v1-xxxxxxxx..." } } } } 配置完成后无需重启,新配置会在下次运行 OpenClaw 时自动生效。
本技能默认使用 bytedance-seed/seedream-4.5 作为文本生图模型,google/gemini-2.5-flash-image 作为图生图模型。你可以通过以下方式更改: 方式一:环境变量配置 在 ~/.openclaw/openclaw.json 中添加: { skills: { entries: { "image-generation": { enabled: true, env: { OPENROUTER_API_KEY: "sk-or-v1-xxx", IMAGE_GEN_TEXT_TO_IMAGE_MODEL: "bytedance-seed/seedream-4.5", IMAGE_GEN_IMAGE_TO_IMAGE_MODEL: "google/gemini-2.5-flash-image" } } } } } 本技能默认使用 bytedance-seed/seedream-4.5 模型,你可以通过以下方式更改: 方式一:环境变量配置 在 ~/.openclaw/openclaw.json 中添加: { skills: { entries: { "image-generation": { enabled: true, env: { OPENROUTER_API_KEY: "sk-or-v1-xxx", IMAGE_GEN_IMAGE_TO_IMAGE_MODEL: "google/gemini-2.5-flash-image", IMAGE_GEN_TEXT_TO_IMAGE_MODEL: "bytedance-seed/seedream-4.5" } } } } 方式二:查看可用模型 node skills/image-generation/scripts/cli/openrouter.js --list-models 方式三:生成时指定模型 node skills/image-generation/scripts/generate.js \ --prompt "a futuristic city" \ --model "bytedance-seed/seedream-4.5" \ --i2i-model "google/gemini-2.5-flash-image" node skills/image-generation/scripts/generate.js \ --prompt "a futuristic city" \ --image "bytedance-seed/seedream-4.5" \ --model "google/gemini-2.5-flash-image" 推荐模型: bytedance-seed/seedream-4.5 - 默认,高质量图像生成 anthropic/claude-3.5-sonnet-image - Claude 图像生成 openai/dall-e-3 - DALL-E 3
node skills/image-generation/scripts/cli/openrouter.js --test 预期输出: { "success": true, "message": "OpenRouter API key is configured. Test passed." }
本技能在 v1 版本中仅支持通过 OpenRouter 提供商进行图像生成。目前不原生支持 Anthropic、Replicate 或 Stability AI 等直接接口。所有生图请求均通过 OpenRouter 统一中转。
文本生图模型 (Text-to-Image): bytedance-seed/seedream-4.5 图生图模型 (Image-to-Image): google/gemini-2.5-flash-image 获取地址: OpenRouter | bytedance-seed/seedream-4.5
OpenClaw 会通过以下 CLI 方式触发图像生成: # 基础生成 node skills/image-generation/scripts/generate.js \ --prompt "a futuristic city at sunset" \ --output "outputs/city.png" # 指定模型、尺寸与比例 (OpenRouter 默认) node skills/image-generation/scripts/generate.js \ --prompt "cyberpunk landscape" \ --model "bytedance-seed/seedream-4.5" \ --i2i-model "google/gemini-2.5-flash-image" \ --size "2K" \ --aspect "16:9" node skills/image-generation/scripts/generate.js \ --prompt "cyberpunk landscape" \ --image "bytedance-seed/seedream-4.5" \ --model "google/gemini-2.5-flash-image" \ --size "2K" \ --aspect "16:9" # 通过 OpenClaw 包装器调用 node skills/image-generation/scripts/cli/openrouter.js \ --prompt "abstract oil painting" \ --size "1K" ### 预检测 (Connectivity Check) OpenClaw 在启动时可运行以下脚本检查 API 连通性: ```bash node skills/image-generation/scripts/cli/openrouter.js --test
参数说明必填默认值--prompt图像描述词是---model文本生图模型 ID否bytedance-seed/seedream-4.5--i2i-model图生图模型 ID否google/gemini-2.5-flash-image--input-image图生图输入图片路径否---list-models列出所有可用模型否---size分辨率等级 (1K|2K|4K)否模型默认--aspect宽高比 (如 1:1, 16:9)否1:1--output输出文件路径否.sisyphus/generated/image_<ts>.png |------|------|------|--------| | --prompt | 图像描述词 | 是 | - | || --model | 图生图模型 ID | 否 | google/gemini-2.5-flash-image | || --image | 文本生图模型 ID | 否 | bytedance-seed/seedream-4.5 | | --list-models | 列出所有可用模型 | 否 | - | | --size | 分辨率等级 (1K|2K|4K) | 否 | 模型默认 | | --aspect | 宽高比 (如 1:1, 16:9) | 否 | 1:1 | | --output | 输出文件路径 | 否 | .sisyphus/generated/image_<ts>.png | | --output | 输出文件路径 | 否 | .sisyphus/generated/image_<ts>.png |
--size 参数格式: 只接受三个字符串值:"1K"、"2K"、"4K" 不要 使用像素格式如 "1024x1024" 或 "3840x2160"(OpenRouter API 不接受) 实际输出像素尺寸(由 size 和 aspect 共同决定): sizeaspect实际像素说明1K1:11024×1024默认,约 1MP1K16:9~1280×720约 0.9MP2K1:12048×2048约 4MP2K16:9~2560×1440约 3.7MP4K1:14096×4096约 16MP4K16:93840×2160标准 4K UHD 重要限制: 并非所有模型都支持 4K,部分模型最高只支持到 2K 4K 生成成本更高(约 2 倍于 1K/2K) 推荐:日常使用 2K(与 1K 同价,质量显著提升) 支持的宽高比:1:1(默认)、2:3、3:2、3:4、4:3、4:5、5:4、9:16、16:9、21:9
符合 cli-contract.md 规范: 代码标签描述0SUCCESS生成成功并已保存到本地1CONFIG_ERROR参数缺失、格式错误或鉴权失败2API_ERROROpenRouter API 调用失败(限流、超时等)3FS_ERROR本地文件系统错误(目录权限、磁盘空间等)
在交付前,请确保通过以下冒烟测试: 环境检查: node skills/image-generation/scripts/cli/openrouter.js --test (返回 success: true) 基础生成: node skills/image-generation/scripts/generate.js --prompt "test" --output "test.png" 路径安全: 确保生成的图片位于 .sisyphus/generated/ 或指定的安全路径下。
扩展新 Provider: 参考 references/extension-guide.md 配置详情: 参考 references/configuration.md CLI 规范: 参考 references/cli-contract.md
Writing, remixing, publishing, visual generation, and marketing content production.
Largest current source with strong distribution and engagement signals.