返回技能列表

nano-banana-pro

swarmclawai
更新于 6 days ago
560
113
560
在 GitHub 上查看
aiapi

关于

This Claude Skill generates and edits images using the Gemini 3 Pro Image API. Use it when you need to create images from text prompts, edit a single existing image, or compose scenes from multiple images (up to 14). It requires a `GEMINI_API_KEY` and the `uv` package manager to run the provided Python scripts.

快速安装

Claude Code

推荐
主要方式
npx skills add swarmclawai/swarmclaw -a claude-code
插件命令备选方式
/plugin add https://github.com/swarmclawai/swarmclaw
Git 克隆备选方式
git clone https://github.com/swarmclawai/swarmclaw.git ~/.claude/skills/nano-banana-pro

在 Claude Code 中复制并粘贴此命令以安装该技能

技能文档

Nano Banana Pro (Gemini 3 Pro Image)

Use the bundled script to generate or edit images.

Generate

uv run {baseDir}/scripts/generate_image.py --prompt "your image description" --filename "output.png" --resolution 1K

Edit (Single Image)

uv run {baseDir}/scripts/generate_image.py --prompt "edit instructions" --filename "output.png" -i "/path/in.png" --resolution 2K

Multi-Image Composition (up to 14 images)

uv run {baseDir}/scripts/generate_image.py --prompt "combine these into one scene" --filename "output.png" -i img1.png -i img2.png -i img3.png

API Key

Set GEMINI_API_KEY as an environment variable, or pass --api-key <KEY> to the script.

Aspect Ratio (optional)

uv run {baseDir}/scripts/generate_image.py --prompt "portrait photo" --filename "output.png" --aspect-ratio 9:16

Notes

  • Resolutions: 1K (default), 2K, 4K.
  • Aspect ratios: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9. Without --aspect-ratio, the model picks freely.
  • Use timestamps in filenames for uniqueness: yyyy-mm-dd-hh-mm-ss-name.png.
  • Do not read the image back into context; report the saved path only.

GitHub 仓库

swarmclawai/swarmclaw
路径: skills/nano-banana-pro
0
agent-frameworkagent-memoryagent-runtimeagent-swarmagentsai

相关推荐技能

content-collections

Content Collections 是一个 TypeScript 优先的构建工具,可将本地 Markdown/MDX 文件转换为类型安全的数据集合。它专为构建博客、文档站和内容密集型 Vite+React 应用而设计,提供基于 Zod 的自动模式验证。该工具涵盖从 Vite 插件配置、MDX 编译到生产环境部署的完整工作流。

查看技能

polymarket

这个Claude Skill为开发者提供完整的Polymarket预测市场开发支持,涵盖API调用、交易执行和市场数据分析。关键特性包括实时WebSocket数据流,可监控实时交易、订单和市场动态。开发者可用它构建预测市场应用、实施交易策略并集成实时市场预测功能。

查看技能

creating-opencode-plugins

该Skill帮助开发者创建OpenCode插件,用于接入命令、文件、LSP等25+种事件。它提供了插件结构、事件API规范和JavaScript/TypeScript实现模式,适合需要拦截操作、扩展功能或自定义事件处理的场景。开发者可通过它快速构建响应式模块来增强OpenCode AI助手的能力。

查看技能

sglang

SGLang是一个专为LLM设计的高性能推理框架,特别适用于需要结构化输出的场景。它通过RadixAttention前缀缓存技术,在处理JSON、正则表达式、工具调用等具有重复前缀的复杂工作流时,能实现极速生成。如果你正在构建智能体或多轮对话系统,并追求远超vLLM的推理性能,SGLang是理想选择。

查看技能