gstack 完全指南：Garry Tan 的开源 AI 软件工厂，一个人干一个团队的活

一句话介绍

gstack 是 Y Combinator CEO Garry Tan 打造的开源 AI 辅助开发工具链，将 Claude Code 变成一个由 23 个专家角色组成的虚拟工程团队，覆盖从产品构思到上线的完整流程。MIT 协议，完全免费。

GitHub 地址：https://github.com/garrytan/gstack
作者：Garry Tan（YC 总裁/CEO，Palantir 早期工程师，Posterous 联合创始人）
协议：MIT License
支持平台：Claude Code、OpenAI Codex CLI、Cursor、OpenCode、Factory Droid、Slate、Kiro、Hermes 等 10 个 AI 编程代理

背景

"I don't think I've typed like a line of code probably since December, basically, which is an extremely large change." — Andrej Karpathy, No Priors podcast, March 2026

Garry Tan 在听到 Karpathy 这句话后，开始探索如何一个人像 20 人的团队一样高效地交付产品。Peter Steinberger 凭一己之力用 AI Agent 打造了 247K Star 的 OpenClaw。Garry 发现，拥有正确工具链的单个构建者可以比传统团队行动更快。

2026 年的 60 天内，Garry 兼职（同时全职运营 YC）交付了 3 个生产服务、40+ 功能。按逻辑代码变更衡量，2026 年的产出速度是 2013 年的 810 倍。

gstack 就是这套方法论的工具化。

核心理念：Sprint 流程

gstack 不是零散工具的集合，而是一个有严格顺序的冲刺流程：

Think - Plan - Build - Review - Test - Ship - Reflect

每一步的输出自动成为下一步的输入，形成闭环：

/office-hours 写出设计文档，/plan-ceo-review 读取
/plan-eng-review 写出测试计划，/qa 继承使用
/review 捕获 bug，/ship 验证修复
不会有东西从缝隙中溜走

23 个专家角色一览

思考阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /office-hours | YC Office Hours | 6 个强制提问重构产品认知，挑战前提假设，生成实现方案 |

规划阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /plan-ceo-review | CEO/创始人 | 挑战范围，找到 10 星产品。四种模式：扩展、选择性扩展、保持范围、缩减 |
| /plan-eng-review | 工程经理 | 锁定架构、数据流、ASCII 图、边界情况和测试 |
| /plan-design-review | 高级设计师 | 0-10 分评审每个设计维度，解释满分标准 |
| /plan-devex-review | DX 负责人 | 开发者体验交互式审查，20-45 个强制问题 |
| /autoplan | 审查流水线 | 一键跑完 CEO - 设计 - 工程 - DX 审查，自动检测哪些适用 |
| /spec | 规格作者 | 将模糊意图转化为精确可执行规格 |

构建阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /design-shotgun | 设计探索器 | 生成 4-6 个 AI 模型方案，可视化对比迭代，有品味记忆 |
| /design-html | 设计工程师 | 将设计稿转为可交付 HTML/CSS（Pretext 布局，30KB，零依赖） |
| /design-consultation | 设计合伙人 | 从零构建完整设计系统 |

审查阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /review | 主管工程师 | 找出通过 CI 但会在生产爆炸的 bug，自动修复明显的 |
| /design-review | 会写代码的设计师 | 同样的设计审查 + 自动修复 |
| /codex | 第二意见 | OpenAI Codex CLI 独立交叉审查，三模式：review/adversarial/consult |
| /cso | CSO 安全官 | OWASP Top 10 + STRIDE 威胁建模，零噪音过滤 |

测试阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /qa | QA 负责人 | 真实浏览器测试、修 bug、生成回归测试 |
| /qa-only | QA 报告员 | 纯报告模式，不改代码 |
| /benchmark | 性能工程师 | Core Web Vitals 基准测试 |

发布阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /ship | 发布工程师 | 同步主分支、跑测试、审计覆盖、开 PR |
| /land-and-deploy | 发布工程师 | 合并 PR - 等 CI - 验证生产环境 |
| /canary | SRE | 发布后监控循环 |

反思阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /retro | 工程经理 | 团队周回顾，每人数据、发布连续记录、测试健康趋势 |
| /learn | 记忆管理 | 管理跨 session 的项目知识，会随时间越来越懂你的代码库 |

工具类

| 命令 | 职责 |
|------|------|
| /browse | 真实 Chromium 浏览器控制 |
| /open-gstack-browser | 启动 GStack Browser（反爬虫隐身、侧边栏 Agent） |
| /investigate | 系统化根因调试，铁律：不调查不修复 |
| /pair-agent | 跨 Agent 浏览器共享（Claude + OpenClaw + Codex 同时操作） |
| /careful / freeze / guard | 安全防护（破坏性命令拦截、编辑锁定） |
| /document-release | 自动更新所有项目文档 |
| /ios-qa | iOS 真机 USB 自动化测试 |

关键能力详解

1. 真实浏览器控制

/browse 和 GStack Browser 提供真实 Chromium 控制：

截图、点击、表单填写
反爬虫隐身（Google、NYTimes 无验证码）
侧边栏 Agent：自然语言控制浏览器
Cookie 导入：测试需要认证的页面
提示注入防御：ML 分类器 + canary token + 联合判定

2. 多 AI 交叉审查

/codex 调用 OpenAI Codex CLI 对同一代码做独立审查。当 Claude 的 /review 和 OpenAI 的 /codex 都审查过同一分支时，会生成跨模型分析，展示哪些发现重叠、哪些是各自独有的。

3. 并行冲刺

搭配 Conductor 可同时运行 10-15 个并行工作流。一个 session 跑 /office-hours，另一个做 /review，第三个实现功能，第四个在 staging 跑 /qa。Sprint 结构让并行不变成混乱。

4. GBrain 持久记忆

/setup-gbrain 一键配置，AI agent 获得跨 session 的持久知识库：

支持 PGLite 本地（零账号，30秒）或 Supabase 云端
/sync-gbrain 从任何仓库重新索引代码
每个仓库可设置信任策略（读写/只读/拒绝）

5. 多平台支持

不仅支持 Claude Code，通过 ./setup --host name 还支持：

| Agent | 安装位置 |
|-------|----------|
| OpenAI Codex CLI | ~/.codex/skills/gstack-/ |
| OpenCode | ~/.config/opencode/skills/gstack-/ |
| Cursor | ~/.cursor/skills/gstack-/ |
| Factory Droid | ~/.factory/skills/gstack-/ |
| Slate | ~/.slate/skills/gstack-/ |
| Kiro | ~/.kiro/skills/gstack-/ |
| Hermes | ~/.hermes/skills/gstack-*/ |

快速上手

环境要求

Claude Code
Git
Bun v1.0+
Node.js（Windows 需要）

30 秒安装

在 Claude Code 中执行：

git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup

安装完成后，按提示在 CLAUDE.md 中添加 gstack 配置段。

团队模式（推荐）

在你的项目仓库中执行：

(cd ~/.claude/skills/gstack && ./setup --team) && ~/.claude/skills/gstack/bin/gstack-team-init required && git add .claude/ CLAUDE.md && git commit -m "require gstack for AI-assisted work"

团队模式特点：

自动更新检查（每小时一次，网络故障安全，完全静默）
不会在仓库中放入供应商文件
无版本漂移

required 表示团队成员必须安装，optional 表示建议安装。

5 分钟体验流程

1. /office-hours  — 描述你想构建什么，它会问你6个关键问题
2. /plan-ceo-review — 让CEO角色审查你的想法
3. /autoplan — 自动跑完所有审查
4. 实现功能
5. /review — 代码审查
6. /qa — 真实浏览器测试
7. /ship — 发布

典型工作流示例

假设你想构建一个「每日简报 App」：

你：   我想做一个日历的每日简报应用。
你：   /office-hours
Claude：问你痛点在哪，要具体例子，不要假设

你：   多个 Google 日历，事件信息过时，地点错误...
      准备工作耗时太久了...

Claude：我要挑战你的框架。你说每日简报应用，
      但你实际描述的是一个私人AI参谋长。
      提取出你没意识到的5个能力
      挑战4个前提，你同意、反对或调整
      生成3个实现方案带工作量估算
      建议：明天先交付最窄的切入点

你：   /plan-ceo-review
      读取设计文档，挑战范围，跑10节审查

你：   /plan-eng-review
      ASCII 数据流图、状态机、错误路径

你：   批准计划。退出计划模式。
      11个文件写入2400行，约8分钟

你：   /review
      自动修复2个问题，1个竞态条件等你确认

你：   /qa https://staging.myapp.com
      打开真实浏览器，走完流程，发现并修复一个bug

你：   /ship
      测试：42 到 51（+9 新增），PR已创建

8 个命令，端到端。这不是 copilot，这是一个团队。

与其他工具的关系

Karpathy 的四个失败模式

Andrej Karpathy 的 AI 编码规则指出四个失败模式：错误假设、过度复杂、无关编辑、命令式优于声明式。gstack 的流程技能全部覆盖：

| 失败模式 | gstack 对应 |
|----------|-------------|
| 错误假设 | /office-hours 在写代码前强制暴露假设 |
| 过度复杂 | Confusion Protocol 阻止 Claude 猜测架构决策 |
| 无关编辑 | /review 捕获不必要的复杂性和顺手改动 |
| 命令式 | /ship 将任务转化为可验证目标，测试先行 |

OpenClaw 集成

gstack 完全兼容 OpenClaw。在 OpenClaw agent 中安装 gstack 后，可直接调度：

| 你说 | 触发 |
|------|------|
| 跑个安全审计 | Claude Code session + /cso |
| 帮我做代码审查 | Claude Code session + /review |
| 构建通知功能 | /autoplan 到实现到 /ship |

适用人群

| 角色 | 核心价值 |
|------|----------|
| 创始人/CEO | 一个人干一个团队的活，兼职也能高频交付 |
| 首次使用 Claude Code | 有结构化的角色和流程，而非空白提示 |
| 技术负责人/架构师 | 每个 PR 自动获得审查、QA 和发布流程 |
| 独立开发者 | 10-15 个并行冲刺，一个人当团队用 |

总结

gstack 本质上是一套 AI 辅助开发的最佳实践流程框架：

流程大于工具：不是简单的 prompt 集合，而是完整的软件工程方法论
角色分工清晰：模拟高效真实团队，CEO 不管 infra bug fix，设计审查不管后端改动
可组合：每个技能独立可用，也可以串联成完整 sprint
跨 AI 平台：不绑定单一 AI 提供商，支持 10 个编码代理
持久记忆：GBrain 让 agent 跨 session 越来越懂你的代码库
安全优先：多层提示注入防御、破坏性命令拦截、编辑锁定

对于想提升 AI 编程效率的个人开发者或小团队来说，这是一个非常值得参考和使用的框架。免费、开源、MIT 协议。Fork it, improve it, make it yours.