返回 AI开源项目

gstack 完全指南:Garry Tan 的开源 AI 软件工厂,一个人干一个团队的活

一句话介绍

gstack 是 Y Combinator CEO Garry Tan 打造的开源 AI 辅助开发工具链,将 Claude Code 变成一个由 23 个专家角色组成的虚拟工程团队,覆盖从产品构思到上线的完整流程。MIT 协议,完全免费。

  • GitHub 地址:https://github.com/garrytan/gstack
  • 作者:Garry Tan(YC 总裁/CEO,Palantir 早期工程师,Posterous 联合创始人)
  • 协议:MIT License
  • 支持平台:Claude Code、OpenAI Codex CLI、Cursor、OpenCode、Factory Droid、Slate、Kiro、Hermes 等 10 个 AI 编程代理

背景

"I don't think I've typed like a line of code probably since December, basically, which is an extremely large change." — Andrej Karpathy, No Priors podcast, March 2026

Garry Tan 在听到 Karpathy 这句话后,开始探索如何一个人像 20 人的团队一样高效地交付产品。Peter Steinberger 凭一己之力用 AI Agent 打造了 247K Star 的 OpenClaw。Garry 发现,拥有正确工具链的单个构建者可以比传统团队行动更快。

2026 年的 60 天内,Garry 兼职(同时全职运营 YC)交付了 3 个生产服务、40+ 功能。按逻辑代码变更衡量,2026 年的产出速度是 2013 年的 810 倍

gstack 就是这套方法论的工具化。


核心理念:Sprint 流程

gstack 不是零散工具的集合,而是一个有严格顺序的冲刺流程:

Think - Plan - Build - Review - Test - Ship - Reflect

每一步的输出自动成为下一步的输入,形成闭环:

  • /office-hours 写出设计文档,/plan-ceo-review 读取
  • /plan-eng-review 写出测试计划,/qa 继承使用
  • /review 捕获 bug,/ship 验证修复
  • 不会有东西从缝隙中溜走

23 个专家角色一览

思考阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /office-hours | YC Office Hours | 6 个强制提问重构产品认知,挑战前提假设,生成实现方案 |

规划阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /plan-ceo-review | CEO/创始人 | 挑战范围,找到 10 星产品。四种模式:扩展、选择性扩展、保持范围、缩减 |
| /plan-eng-review | 工程经理 | 锁定架构、数据流、ASCII 图、边界情况和测试 |
| /plan-design-review | 高级设计师 | 0-10 分评审每个设计维度,解释满分标准 |
| /plan-devex-review | DX 负责人 | 开发者体验交互式审查,20-45 个强制问题 |
| /autoplan | 审查流水线 | 一键跑完 CEO - 设计 - 工程 - DX 审查,自动检测哪些适用 |
| /spec | 规格作者 | 将模糊意图转化为精确可执行规格 |

构建阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /design-shotgun | 设计探索器 | 生成 4-6 个 AI 模型方案,可视化对比迭代,有品味记忆 |
| /design-html | 设计工程师 | 将设计稿转为可交付 HTML/CSS(Pretext 布局,30KB,零依赖) |
| /design-consultation | 设计合伙人 | 从零构建完整设计系统 |

审查阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /review | 主管工程师 | 找出通过 CI 但会在生产爆炸的 bug,自动修复明显的 |
| /design-review | 会写代码的设计师 | 同样的设计审查 + 自动修复 |
| /codex | 第二意见 | OpenAI Codex CLI 独立交叉审查,三模式:review/adversarial/consult |
| /cso | CSO 安全官 | OWASP Top 10 + STRIDE 威胁建模,零噪音过滤 |

测试阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /qa | QA 负责人 | 真实浏览器测试、修 bug、生成回归测试 |
| /qa-only | QA 报告员 | 纯报告模式,不改代码 |
| /benchmark | 性能工程师 | Core Web Vitals 基准测试 |

发布阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /ship | 发布工程师 | 同步主分支、跑测试、审计覆盖、开 PR |
| /land-and-deploy | 发布工程师 | 合并 PR - 等 CI - 验证生产环境 |
| /canary | SRE | 发布后监控循环 |

反思阶段

| 命令 | 角色 | 职责 |
|------|------|------|
| /retro | 工程经理 | 团队周回顾,每人数据、发布连续记录、测试健康趋势 |
| /learn | 记忆管理 | 管理跨 session 的项目知识,会随时间越来越懂你的代码库 |

工具类

| 命令 | 职责 |
|------|------|
| /browse | 真实 Chromium 浏览器控制 |
| /open-gstack-browser | 启动 GStack Browser(反爬虫隐身、侧边栏 Agent) |
| /investigate | 系统化根因调试,铁律:不调查不修复 |
| /pair-agent | 跨 Agent 浏览器共享(Claude + OpenClaw + Codex 同时操作) |
| /careful / freeze / guard | 安全防护(破坏性命令拦截、编辑锁定) |
| /document-release | 自动更新所有项目文档 |
| /ios-qa | iOS 真机 USB 自动化测试 |


关键能力详解

1. 真实浏览器控制

/browse 和 GStack Browser 提供真实 Chromium 控制:

  • 截图、点击、表单填写
  • 反爬虫隐身(Google、NYTimes 无验证码)
  • 侧边栏 Agent:自然语言控制浏览器
  • Cookie 导入:测试需要认证的页面
  • 提示注入防御:ML 分类器 + canary token + 联合判定

2. 多 AI 交叉审查

/codex 调用 OpenAI Codex CLI 对同一代码做独立审查。当 Claude 的 /review 和 OpenAI 的 /codex 都审查过同一分支时,会生成跨模型分析,展示哪些发现重叠、哪些是各自独有的。

3. 并行冲刺

搭配 Conductor 可同时运行 10-15 个并行工作流。一个 session 跑 /office-hours,另一个做 /review,第三个实现功能,第四个在 staging 跑 /qa。Sprint 结构让并行不变成混乱。

4. GBrain 持久记忆

/setup-gbrain 一键配置,AI agent 获得跨 session 的持久知识库:

  • 支持 PGLite 本地(零账号,30秒)或 Supabase 云端
  • /sync-gbrain 从任何仓库重新索引代码
  • 每个仓库可设置信任策略(读写/只读/拒绝)

5. 多平台支持

不仅支持 Claude Code,通过 ./setup --host name 还支持:

| Agent | 安装位置 |
|-------|----------|
| OpenAI Codex CLI | ~/.codex/skills/gstack-/ |
| OpenCode | ~/.config/opencode/skills/gstack-
/ |
| Cursor | ~/.cursor/skills/gstack-/ |
| Factory Droid | ~/.factory/skills/gstack-
/ |
| Slate | ~/.slate/skills/gstack-/ |
| Kiro | ~/.kiro/skills/gstack-
/ |
| Hermes | ~/.hermes/skills/gstack-*/ |


快速上手

环境要求

  • Claude Code
  • Git
  • Bun v1.0+
  • Node.js(Windows 需要)

30 秒安装

在 Claude Code 中执行:

git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup

安装完成后,按提示在 CLAUDE.md 中添加 gstack 配置段。

团队模式(推荐)

在你的项目仓库中执行:

(cd ~/.claude/skills/gstack && ./setup --team) && ~/.claude/skills/gstack/bin/gstack-team-init required && git add .claude/ CLAUDE.md && git commit -m "require gstack for AI-assisted work"

团队模式特点:

  • 自动更新检查(每小时一次,网络故障安全,完全静默)
  • 不会在仓库中放入供应商文件
  • 无版本漂移

required 表示团队成员必须安装,optional 表示建议安装。

5 分钟体验流程

1. /office-hours  — 描述你想构建什么,它会问你6个关键问题
2. /plan-ceo-review — 让CEO角色审查你的想法
3. /autoplan — 自动跑完所有审查
4. 实现功能
5. /review — 代码审查
6. /qa — 真实浏览器测试
7. /ship — 发布

典型工作流示例

假设你想构建一个「每日简报 App」:

你:   我想做一个日历的每日简报应用。
你:   /office-hours
Claude:问你痛点在哪,要具体例子,不要假设

你:   多个 Google 日历,事件信息过时,地点错误...
      准备工作耗时太久了...

Claude:我要挑战你的框架。你说每日简报应用,
      但你实际描述的是一个私人AI参谋长。
      提取出你没意识到的5个能力
      挑战4个前提,你同意、反对或调整
      生成3个实现方案带工作量估算
      建议:明天先交付最窄的切入点

你:   /plan-ceo-review
      读取设计文档,挑战范围,跑10节审查

你:   /plan-eng-review
      ASCII 数据流图、状态机、错误路径

你:   批准计划。退出计划模式。
      11个文件写入2400行,约8分钟

你:   /review
      自动修复2个问题,1个竞态条件等你确认

你:   /qa https://staging.myapp.com
      打开真实浏览器,走完流程,发现并修复一个bug

你:   /ship
      测试:42 到 51(+9 新增),PR已创建

8 个命令,端到端。这不是 copilot,这是一个团队。


与其他工具的关系

Karpathy 的四个失败模式

Andrej Karpathy 的 AI 编码规则指出四个失败模式:错误假设、过度复杂、无关编辑、命令式优于声明式。gstack 的流程技能全部覆盖:

| 失败模式 | gstack 对应 |
|----------|-------------|
| 错误假设 | /office-hours 在写代码前强制暴露假设 |
| 过度复杂 | Confusion Protocol 阻止 Claude 猜测架构决策 |
| 无关编辑 | /review 捕获不必要的复杂性和顺手改动 |
| 命令式 | /ship 将任务转化为可验证目标,测试先行 |

OpenClaw 集成

gstack 完全兼容 OpenClaw。在 OpenClaw agent 中安装 gstack 后,可直接调度:

| 你说 | 触发 |
|------|------|
| 跑个安全审计 | Claude Code session + /cso |
| 帮我做代码审查 | Claude Code session + /review |
| 构建通知功能 | /autoplan 到实现到 /ship |


适用人群

| 角色 | 核心价值 |
|------|----------|
| 创始人/CEO | 一个人干一个团队的活,兼职也能高频交付 |
| 首次使用 Claude Code | 有结构化的角色和流程,而非空白提示 |
| 技术负责人/架构师 | 每个 PR 自动获得审查、QA 和发布流程 |
| 独立开发者 | 10-15 个并行冲刺,一个人当团队用 |


总结

gstack 本质上是一套 AI 辅助开发的最佳实践流程框架:

  1. 流程大于工具:不是简单的 prompt 集合,而是完整的软件工程方法论
  2. 角色分工清晰:模拟高效真实团队,CEO 不管 infra bug fix,设计审查不管后端改动
  3. 可组合:每个技能独立可用,也可以串联成完整 sprint
  4. 跨 AI 平台:不绑定单一 AI 提供商,支持 10 个编码代理
  5. 持久记忆:GBrain 让 agent 跨 session 越来越懂你的代码库
  6. 安全优先:多层提示注入防御、破坏性命令拦截、编辑锁定

对于想提升 AI 编程效率的个人开发者或小团队来说,这是一个非常值得参考和使用的框架。免费、开源、MIT 协议。Fork it, improve it, make it yours.