MCP HubMCP Hub
Вернуться к навыкам

openai-image-gen

swarmclawai
Обновлено 6 days ago
560
113
560
Посмотреть на GitHub
Метаaiapi

О программе

Этот навык Claude генерирует изображения с использованием моделей OpenAI DALL-E 2, DALL-E 3 и GPT Image через их API. Он поддерживает пакетную генерацию со случайной выборкой промптов и выводит HTML-галерею для удобного просмотра. Используйте его, когда вам нужно создавать изображения через OpenAI и у вас есть доступный OPENAI_API_KEY.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add swarmclawai/swarmclaw -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/swarmclawai/swarmclaw
Git клонированиеАльтернативный
git clone https://github.com/swarmclawai/swarmclaw.git ~/.claude/skills/openai-image-gen

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

OpenAI Image Gen

Generate images via the OpenAI Images API with an HTML gallery viewer.

Run

Note: Image generation can take longer than typical timeouts. Set a higher timeout when running via shell (e.g., 300 seconds).

python3 {baseDir}/scripts/gen.py

Useful Flags

# GPT image models with various options
python3 {baseDir}/scripts/gen.py --count 16 --model gpt-image-1
python3 {baseDir}/scripts/gen.py --prompt "ultra-detailed studio photo of a lobster astronaut" --count 4
python3 {baseDir}/scripts/gen.py --size 1536x1024 --quality high --out-dir ./out/images
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp

# DALL-E 3 (note: count is automatically limited to 1)
python3 {baseDir}/scripts/gen.py --model dall-e-3 --quality hd --size 1792x1024 --style vivid
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "serene mountain landscape"

# DALL-E 2
python3 {baseDir}/scripts/gen.py --model dall-e-2 --size 512x512 --count 4

Model-Specific Parameters

Size

  • GPT image models (gpt-image-1, gpt-image-1-mini, gpt-image-1.5): 1024x1024, 1536x1024 (landscape), 1024x1536 (portrait), or auto. Default: 1024x1024
  • dall-e-3: 1024x1024, 1792x1024, or 1024x1792. Default: 1024x1024
  • dall-e-2: 256x256, 512x512, or 1024x1024. Default: 1024x1024

Quality

  • GPT image models: auto, high, medium, or low. Default: high
  • dall-e-3: hd or standard. Default: standard
  • dall-e-2: standard only

Other Parameters

  • GPT image models support --background (transparent, opaque, auto) and --output-format (png, jpeg, webp)
  • dall-e-3 supports --style (vivid for hyper-real, natural for more natural looking)
  • dall-e-3 only supports n=1; the script automatically limits count to 1

Output

  • Image files (*.png, *.jpeg, or *.webp depending on model and format)
  • prompts.json (prompt-to-file mapping)
  • index.html (thumbnail gallery — open in browser to review)

GitHub репозиторий

swarmclawai/swarmclaw
Путь: skills/openai-image-gen
0
agent-frameworkagent-memoryagent-runtimeagent-swarmagentsai

Похожие навыки

content-collections

Мета

Этот навык предоставляет проверенную в продакшене настройку для Content Collections — TypeScript-ориентированного инструмента, который преобразует файлы Markdown/MDX в типобезопасные коллекции данных с валидацией Zod. Используйте его при создании блогов, сайтов документации или контентных приложений на Vite + React для обеспечения типобезопасности и автоматической проверки содержимого. Он охватывает всё: от настройки плагина Vite и компиляции MDX до оптимизации развертывания и валидации схем.

Просмотреть навык

polymarket

Мета

Этот навык позволяет разработчикам создавать приложения на платформе прогнозных рынков Polymarket, включая интеграцию с API для торговли и получения рыночных данных. Он также обеспечивает потоковую передачу данных в реальном времени через WebSocket для отслеживания текущих сделок и рыночной активности. Используйте его для реализации торговых стратегий или создания инструментов, обрабатывающих обновления рынка в реальном времени.

Просмотреть навык

creating-opencode-plugins

Мета

Этот навык помогает разработчикам создавать плагины OpenCode, которые подключаются к более чем 25 типам событий, таким как команды, файлы и операции LSP. Он предоставляет структуру плагина, спецификации API событий и шаблоны реализации для модулей на JavaScript/TypeScript. Используйте его, когда вам нужно перехватывать, отслеживать или расширять жизненный цикл ассистента OpenCode AI с помощью пользовательской событийно-ориентированной логики.

Просмотреть навык

sglang

Мета

SGLang — это высокопроизводительный фреймворк для обслуживания больших языковых моделей (LLM), специализирующийся на быстрой структурированной генерации JSON, regex и рабочих процессов агентов с использованием кэширования префиксов RadixAttention. Он обеспечивает значительно более высокую скорость вывода, особенно для задач с повторяющимися префиксами, что делает его идеальным для сложных структурированных результатов и многократных диалогов. Выбирайте SGLang вместо альтернатив, таких как vLLM, когда вам требуется ограниченное декодирование или вы создаете приложения с интенсивным совместным использованием префиксов.

Просмотреть навык