GStack的26种工作流角色,真正实现一人成军!

GStack 是什么?
GStack 是由 Y Combinator 现任 CEO Garry Tan 创建并维护的开源项目,其核心使命是将 Claude Code 从一个通用 AI 助手转变为可按需召唤的专业开发团队 。
Github 地址:https://github.com/garrytan/gstack
Stars 数:68.8k

定位:AI 驱动的「虚拟软件工厂」,不是提示词集合,而是完整工程流程
原理:把大模型拆成各司其职的专家角色,每个角色有固定职责、流程、输出
效果:单人开发效率 ≈ 20 人传统团队
作者亲测:60 天写 60 万行生产代码(35% 测试),日均 1–2 万行
为什么叫一人成军
GStack 特色
| 维度 | 说明 |
|---|---|
| 角色覆盖度 | 26 个技能对应 26个不同专业角色,从 CEO、设计师、工程师到 QA、安全官、技术文档,覆盖了完整的产品团队 |
| 流程闭环 | 从需求探索(/office-hours)→ 规划(plan-*)→ 设计 → 开发 → 测试 → 发布 → 复盘,完整闭环 |
| 决策分层 | 不是简单的自动化,而是模拟真实团队的决策流程(CEO 定方向、设计师控体验、工程师保质量) |
| 多智能体协作 | /pair-agent 甚至支持多个 AI 同时工作,真正实现"团队"协作 |
传统 AI 编码 vs GStack 的"一人成军"
| 传统 AI 编码 | GStack "一人成军" |
|---|---|
| 一个通用助手,思维模式混杂 | 26 个专业角色,各司其职 |
| 提示词即兴发挥,质量不稳定 | 结构化工作流,可重复、可预期 |
| 单点辅助(只写代码) | 端到端覆盖(需求→设计→开发→测试→发布) |
| 个人效率工具 | 模拟完整创业团队 |
核心定位
GStack 的本质是一组基于 Claude Code 的角色化工作流过程(在项目中被称为"skills"),它通过定义明确的角色分工,解决了传统 AI 编码工具中"思维模式混杂"的问题。每个命令对应一个特定的专业角色,让 AI 在特定任务中采用相应的认知模式。
Gstack 是一个过程,而不是工具的集合。技能的运行顺序是冲刺的顺序:
Think → Plan → Build → Review → Test → Ship → Reflect
想想→规划→建造→审查→测试→船只→反思
每个技能都会衔接下一个。/office-hours 会写一份设计文档,/plan-ceo-review 会阅读。/plan-eng-review 编写测试计划,/QA 会接收到。/review 发现了 /ship 验证已修复的 bug。没有任何遗漏,因为每一步都知道之前发生过什么。
安装 GStack
打开 Claude Code,输入以下命令自动安装:
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
遇到的坑:安装的过程中,需要先安装 bun,我安装了很多次 bun 都失败了,可以试着切换下网络再次安装 bun,或者在其他命令行单独安装 bun,安装完后还需要加到环境变量中才能生效。
安装完成后就会在 ~/.claude/skills/gstack 目录下有多个 skill。

比如进入到 office-hours 目录下,有个 SKILL.md 文件,内容很长。

主要功能
GStack 提供了 30+ 个斜杠命令(slash commands),覆盖从规划到发布的完整开发流程

测试 GStack
office-hours 产品经理
这个技能类似 CEO/产品经理进行头脑风暴,对产品进行构思和需求梳理,通过提问将模糊需求转化为可执行方案。
这个名字源自硅谷创业文化中的**"办公室时间"——创始人或投资人每周固定开放的时间段,供创业者预约咨询、讨论想法。GStack 用这个名字强调这是一个低门槛、对话式**的入口,适合在正式规划前进行头脑风暴和需求梳理 。
如果你有一个模糊的产品想法但不知道如何开始,这就是第一个应该运行的命令。
在这个角色下,Claude 不会直接给你答案,而是通过连续提问的方式,帮助你把模糊的想法转化为清晰、可执行的产品需求。
如下所示,通过我和它对话整理了三个草案。

然后由我来选择哪种草案,接着它会一步一步完善方案。

plan-design-review 设计负责人
角色定位
设计负责人(Design Lead)是 GStack 规划阶段的关键角色之一,专注于从用户体验和视觉设计角度审查功能规划,确保产品不仅技术可行,而且易用、美观、符合设计规范。
主要职责
该角色在执行 /plan-design-review 命令时,会重点关注以下方面

比如对我的一份设计文档先进行打分,最开始打分是 3 分,然后会不断进行修改,最后得到 10 分。


GStack 技术架构
- 技能系统:基于 Markdown 提示文件,通过 Claude Code 的自定义命令功能集成
- 浏览器自动化:基于 Playwright 构建持久化 Chromium 会话,支持 Cookie 导入和真实环境测试
- 多平台支持:除 Claude Code 外,还支持 OpenAI Codex CLI、Cursor、OpenCode 等 8 种 AI 编码工具
- 团队模式:支持全局安装和项目级安装,可配置自动更新,确保团队成员使用一致版本
GStack 适用人群
根据官方文档,GStack 特别适合
- 创始人和 CEO — 尤其是希望亲自参与交付的技术型创始人
- 首次使用 Claude Code 的用户 — 提供结构化角色,而非空白提示
- 技术负责人和资深工程师 — 对每个 PR 进行严格审查、QA 和发布自动化
GStack 项目信息
- GitHub 地址:https://github.com/garrytan/gstack
- 开源协议:MIT License
- 最新版本:截至 2026 年 3 月约为 v0.4.3
- 安装方式:30 秒快速安装,通过 Git 克隆到 Claude Code 的 skills 目录即可
GStack 的核心理念是:通过结构化的角色分工和审查流程,将 AI 辅助开发从模糊的通用对话升级为专业的工程工作流,帮助个人开发者或小型团队实现"一人成军"的开发效率
附录 GStack 角色定位
规划阶段
| 命令 | 角色 | 功能 |
|---|---|---|
/office-hours | CEO/产品经理 | 起始点。通过 6 个强制性问题,在写代码前重新定义产品。挑战你的前提假设,提出替代方案。输出的设计文档会流向所有下游技能。 |
/plan-ceo-review | 首席执行官/创始人 | 重新思考问题,找到隐藏在需求中的"10 星产品"。四种模式:扩展、选择扩展、保持范围、缩减。 |
/plan-eng-review | 工程经理 | 锁定架构、数据流、图表、边界情况和测试。将隐藏的假设暴露出来。 |
/plan-design-review | 高级设计师 | 给每个设计维度打 0-10 分,解释 10 分是什么样的,然后修改计划以达到目标。AI 低质内容检测。交互式——每个设计选择只问一个用户问题。 |
/plan-devex-review | 开发体验负责人 | 交互式 DX 评估:探索开发者画像,对比竞品的 TTHW(首次上手时间),设计你的"魔法时刻",逐步追踪摩擦点。三种模式:DX 扩展、DX 打磨、DX 分诊。20-45 个强制性问题。 |
/autoplan | 评审流程 | 一个命令,生成完整审核过的计划。自动运行 CEO → 设计 → 工程评审,仅将品味相关的决策提交你批准。 |
设计阶段
| 命令 | 角色 | 功能 |
|---|---|---|
/design-consultation | 设计合作伙伴 | 从零构建完整的设计系统。研究市场环境,提出创意风险,生成逼真的产品模型。 |
/design-review | 会写代码的设计师 | 执行与 /plan-design-review 相同的审核,然后修复发现的问题。原子提交,附带前后对比截图。 |
/design-shotgun | 设计探索器 | "给我看选项"。生成 4-6 个 AI 模型变体,在浏览器中打开对比板,收集反馈并迭代。品味记忆会学习你的偏好。重复直到满意,然后交给 /design-html。 |
/design-html | 设计工程师 | 将模型转化为真正能用的生产级 HTML。预计算布局:文本重排、高度自适应、动态布局。30KB,零依赖。自动检测 React/Svelte/Vue。针对设计类型(落地页/仪表盘/表单)智能路由 API。输出可直接上线,不是演示稿。 |
开发审查阶段
| 命令 | 角色 | 功能 |
|---|---|---|
/review | 资深工程师 | 找出那些能通过 CI 但在生产环境爆炸的 bug。自动修复明显的问题。标记完整性缺口。 |
/investigate | 调试器 | 系统化的根因调试。铁律:不调查就不修复。追踪数据流,验证假设,修复失败 3 次后停止。 |
/devex-review | DX 测试员 | 实时开发者体验审计。实际测试你的 onboarding:浏览文档,尝试入门流程,计时 TTHW,截图错误。与 /plan-devex-review 的评分对比——检验计划与现实的差距。 |
测试与质量保证
| 命令 | 角色 | 功能 |
|---|---|---|
/qa | QA 负责人 | 测试应用,发现 bug,用原子提交修复,重新验证。为每个修复自动生成回归测试。 |
/qa-only | QA 记录员 | 与 /qa 方法相同,但只报告不修复。纯 bug 报告,不改动代码。 |
/browse | QA 工程师 | 给 AI 装上眼睛。真实的 Chromium 浏览器,真实的点击,真实的截图。每条约 100ms。/open-gstack-browser 启动带侧边栏、反机器人隐身和自动模型路由的 GStack 浏览器。 |
/setup-browser-cookies | 会话管理器 | 从真实浏览器(Chrome/Arc/Brave/Edge)导入 Cookie 到无头会话。用于测试需要登录的页面。 |
安全与合规
| 命令 | 角色 | 功能 |
|---|---|---|
/cso | 首席安全官 | OWASP Top 10 + STRIDE 威胁建模。零噪音:17 类误报排除,8/10+ 置信度门槛,独立发现验证。每个发现都包含具体的利用场景。 |
发布与部署
| 命令 | 角色 | 功能 |
|---|---|---|
/ship | 发布工程师 | 同步主分支,运行测试,审计覆盖率,推送,开启 PR。如果没有测试框架,自动初始化。 |
/land-and-deploy | 发布工程师 | 合并 PR,等待 CI 和部署,验证生产环境健康。一个命令从"已批准"到"生产环境已验证"。 |
/canary | SRE | 部署后监控循环。监控控制台错误、性能回退和页面故障。 |
/benchmark | 性能工程师 | 基线化页面加载时间、Core Web Vitals 和资源大小。对比每个 PR 的前后表现。 |
/document-release | 技术文档工程师 | 更新所有项目文档以匹配刚发布的版本。自动识别过时的 README。 |
协作与多智能体
| 命令 | 角色 | 功能 |
|---|---|---|
/pair-agent | 多智能体协调员 | 与任何 AI 智能体共享浏览器。一个命令,一次粘贴,即可连接。支持 OpenClaw、Hermes、Codex、Cursor 等。每个智能体独立标签页。自动启动有头模式以便观察。自动开启 ngrok 隧道供远程智能体使用。令牌作用域隔离、标签隔离、速率限制、活动归因。 |
复盘与学习
| 命令 | 角色 | 功能 |
|---|---|---|
/retro | 工程经理 | 团队感知的每周复盘。人均细分、连续发布 streak、测试健康趋势、成长机会。/retro global 跨所有项目和 AI 工具(Claude Code、Codex、Gemini)运行。 |
/learn | 记忆 | 管理 GStack 在会话间学到的内容。审核、搜索、修剪并导出项目特定的模式、陷阱和偏好。学习会跨会话累积,让 GStack 随着时间更懂你的代码库。 |
