Requirements
- Target platform
- OpenClaw
- Install method
- Manual import
- Extraction
- Extract archive
- Prerequisites
- OpenClaw
- Primary doc
- SKILL.md
비라틴 문자(한글, 일본어, 중국어 등)를 AI 이미지에 정확히 렌더링하는 스킬. Canvas 프리렌더링과 Gemini를 활용하여 텍스트 깨짐 없이 이미지를 생성합니다.
비라틴 문자(한글, 일본어, 중국어 등)를 AI 이미지에 정확히 렌더링하는 스킬. Canvas 프리렌더링과 Gemini를 활용하여 텍스트 깨짐 없이 이미지를 생성합니다.
Hand the extracted package to your coding agent with a concrete install brief instead of figuring it out manually.
I downloaded a skill package from Yavira. Read SKILL.md from the extracted folder and install it by following the included instructions. Tell me what you changed and call out any manual steps you could not complete.
I downloaded an updated skill package from Yavira. Read SKILL.md from the extracted folder, compare it with my current installation, and upgrade it while preserving any custom configuration unless the package docs explicitly say otherwise. Summarize what changed and any follow-up checks I should run.
AI 이미지 모델은 한글·한자·일본어 등 비라틴 문자를 직접 그리면 글자가 깨지거나 오타가 생깁니다. 이 스킬은 웹앱과 완전히 동일한 파이프라인을 제공합니다: detect — 프롬프트에 비라틴 문자가 있는지 감지 analyze — Gemini LLM으로 프롬프트에서 텍스트와 스타일 추출 render — Canvas로 정확한 폰트를 사용해 텍스트를 PNG 프리렌더링 generate — 프리렌더링 PNG를 Gemini 이미지 생성에 인풋으로 넣어 최종 이미지 생성
cd {baseDir} && node setup.mjs canvas + @google/generative-ai npm 패키지 설치 Noto Sans 폰트 파일을 {baseDir}/fonts/에 준비
변수필수설명GEMINI_API_KEY⭐ 필수Gemini Flash(분석) + Gemini Image(생성) 모두에 사용GEMINI_IMAGE_MODEL선택이미지 생성 모델 (기본: gemini-3-pro-image-preview)
전체 파이프라인을 한 명령어로 실행합니다: node {baseDir}/render.mjs pipeline "욎홎 뙤앾뼡이라는 지역 축제 포스터 만들어줘" \ --output /tmp/final-image.png --no-base64 결과: { "detect": { "needsRendering": true, "primaryScript": "hangul", ... }, "analyze": { "texts": [...], "style": {...}, "reasoning": "..." }, "render": { "success": true, "outputPath": "/tmp/text-render-xxx.png", ... }, "generate": { "success": true, "outputPath": "/tmp/final-image.png", ... } }
Step 1: 비라틴 문자 감지 (detect) node {baseDir}/render.mjs detect "사용자 프롬프트 전체" needsRendering: false → 프리렌더링 없이 일반 이미지 생성 진행 needsRendering: true → Step 2로 진행 Step 2: Gemini LLM 프롬프트 분석 (analyze) node {baseDir}/render.mjs analyze "욎홎 뙤앾뼡이라는 지역 축제 포스터 만들어줘" Gemini Flash가 프롬프트를 분석하여: 이미지에 들어갈 텍스트 추출 (따옴표, 레이블, 맥락 기반) 디자인 맥락에 맞는 스타일 결정 (폰트, 크기, 색상) 각 텍스트의 역할(headline/subheadline/body/caption) 지정 각 텍스트의 스크립트·언어 자동 감지 GEMINI_API_KEY가 없으면 규칙 기반 fallback이 동작합니다. Step 3: Canvas 프리렌더링 (render) analyze 결과를 그대로 render에 전달합니다: node {baseDir}/render.mjs render \ --json '{"texts":[...],"style":{...}}' \ --output /tmp/rendered-text.png 또는 JSON 파일로: node {baseDir}/render.mjs render --input /tmp/analysis.json --output /tmp/rendered-text.png Step 4: Gemini 이미지 생성 (generate) 프리렌더링된 텍스트 PNG를 Gemini에 인풋 이미지로 넣어서 최종 이미지를 생성합니다. node {baseDir}/render.mjs generate \ --prompt "욎홎 뙤앾뼡이라는 지역 축제 포스터 만들어줘" \ --rendered /tmp/rendered-text.png \ --analysis '{"texts":[...],"style":{...}}' \ --output /tmp/final-image.png \ --no-base64 이 명령어는 내부적으로: 프리렌더링 PNG를 첫 번째 참조 이미지로 Gemini에 전달 buildTextRenderFinalPrompt로 프롬프트를 구성 (텍스트 목록 + 스타일 + "텍스트를 다시 그리지 말고 그대로 사용하라" 지침) Gemini가 텍스트를 자연스럽게 통합한 최종 이미지를 생성 추가 참조 이미지가 있으면 --ref로 전달: node {baseDir}/render.mjs generate \ --prompt "포스터 만들어줘" \ --rendered /tmp/rendered-text.png \ --ref /tmp/user-reference.jpg \ --output /tmp/final-image.png
언어sans-serifserifdisplayhandwriting한국어Noto Sans KRNoto Serif KRBlack Han SansNanum Pen Script일본어Noto Sans JPNoto Serif JPNoto Sans JPNoto Sans JP중국어Noto Sans SCNoto Serif SCNoto Sans SCNoto Sans SC태국어Noto Sans Thai———영어InterGeorgiaImpactComic Sans MS
role용도크기 비율headline메인 제목1.0xsubheadline부제목0.7xbody본문0.5xcaption캡션/설명0.4x
fontSize픽셀small24pxmedium36pxlarge48pxxlarge72px
이 스킬은 사용자 프롬프트에 다음 키워드가 포함되어 있을 때 자동 활성화됩니다: 텍스트, 글자, 문구, 로고, 워터마크, 브랜드, 글씨, 제목, 헤드라인, text, logo, title, headline, 또는 프롬프트에 한글/한자/일본어/태국어/아랍어 등 비라틴 문자가 포함된 경우.
비라틴 문자가 감지되면 반드시 전체 파이프라인 (detect→analyze→render→generate)을 실행한다 analyze로 LLM이 텍스트와 스타일을 추출하도록 한다 render로 Canvas 프리렌더링 PNG를 생성한다 generate로 프리렌더링 PNG를 Gemini에 인풋으로 넣어 최종 이미지를 생성한다
AI 모델에게 비라틴 문자를 직접 그리라고 요청하지 않는다 프리렌더링 없이 한글/한자/일본어 텍스트를 이미지 프롬프트에 포함하지 않는다 render 단계를 건너뛰고 바로 generate하지 않는다 analyze 결과에서 텍스트를 임의로 수정하지 않는다
Agent frameworks, memory systems, reasoning layers, and model-native orchestration.
Largest current source with strong distribution and engagement signals.