跳至主要內容

GStack的26种工作流角色,真正实现一人成军!

悟空约 2957 字大约 10 分钟...

GStack 是什么?

GStack 是由 Y Combinator 现任 CEO Garry Tan 创建并维护的开源项目,其核心使命是将 Claude Code 从一个通用 AI 助手转变为可按需召唤的专业开发团队

Github 地址:https://github.com/garrytan/gstackopen in new window

Stars 数:68.8k

定位:AI 驱动的「虚拟软件工厂」,不是提示词集合,而是完整工程流程

原理:把大模型拆成各司其职的专家角色,每个角色有固定职责、流程、输出

效果:单人开发效率 ≈ 20 人传统团队

作者亲测:60 天写 60 万行生产代码(35% 测试),日均 1–2 万行

为什么叫一人成军

GStack 特色

维度说明
角色覆盖度26 个技能对应 26个不同专业角色,从 CEO、设计师、工程师到 QA、安全官、技术文档,覆盖了完整的产品团队
流程闭环从需求探索(/office-hours)→ 规划(plan-*)→ 设计 → 开发 → 测试 → 发布 → 复盘,完整闭环
决策分层不是简单的自动化,而是模拟真实团队的决策流程(CEO 定方向、设计师控体验、工程师保质量)
多智能体协作/pair-agent 甚至支持多个 AI 同时工作,真正实现"团队"协作

传统 AI 编码 vs GStack 的"一人成军"

传统 AI 编码GStack "一人成军"
一个通用助手,思维模式混杂26 个专业角色,各司其职
提示词即兴发挥,质量不稳定结构化工作流,可重复、可预期
单点辅助(只写代码)端到端覆盖(需求→设计→开发→测试→发布)
个人效率工具模拟完整创业团队

核心定位

GStack 的本质是一组基于 Claude Code 的角色化工作流过程(在项目中被称为"skills"),它通过定义明确的角色分工,解决了传统 AI 编码工具中"思维模式混杂"的问题。每个命令对应一个特定的专业角色,让 AI 在特定任务中采用相应的认知模式。

Gstack 是一个过程,而不是工具的集合。技能的运行顺序是冲刺的顺序:

Think → Plan → Build → Review → Test → Ship → Reflect
想想→规划→建造→审查→测试→船只→反思

每个技能都会衔接下一个。/office-hours 会写一份设计文档,/plan-ceo-review 会阅读。/plan-eng-review 编写测试计划,/QA 会接收到。/review 发现了 /ship 验证已修复的 bug。没有任何遗漏,因为每一步都知道之前发生过什么。

安装 GStack

打开 Claude Code,输入以下命令自动安装:

git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup

遇到的坑:安装的过程中,需要先安装 bun,我安装了很多次 bun 都失败了,可以试着切换下网络再次安装 bun,或者在其他命令行单独安装 bun,安装完后还需要加到环境变量中才能生效。

安装完成后就会在 ~/.claude/skills/gstack 目录下有多个 skill。

比如进入到 office-hours 目录下,有个 SKILL.mdopen in new window 文件,内容很长。

主要功能

GStack 提供了 30+ 个斜杠命令(slash commands),覆盖从规划到发布的完整开发流程

测试 GStack

office-hours 产品经理

这个技能类似 CEO/产品经理进行头脑风暴,对产品进行构思和需求梳理,通过提问将模糊需求转化为可执行方案。

这个名字源自硅谷创业文化中的**"办公室时间"——创始人或投资人每周固定开放的时间段,供创业者预约咨询、讨论想法。GStack 用这个名字强调这是一个低门槛、对话式**的入口,适合在正式规划前进行头脑风暴和需求梳理 。

如果你有一个模糊的产品想法但不知道如何开始,这就是第一个应该运行的命令。

在这个角色下,Claude 不会直接给你答案,而是通过连续提问的方式,帮助你把模糊的想法转化为清晰、可执行的产品需求。

如下所示,通过我和它对话整理了三个草案。

然后由我来选择哪种草案,接着它会一步一步完善方案。

image-20260410204125744
image-20260410204125744

plan-design-review 设计负责人

角色定位

设计负责人(Design Lead)是 GStack 规划阶段的关键角色之一,专注于从用户体验和视觉设计角度审查功能规划,确保产品不仅技术可行,而且易用、美观、符合设计规范

主要职责

该角色在执行 /plan-design-review 命令时,会重点关注以下方面

比如对我的一份设计文档先进行打分,最开始打分是 3 分,然后会不断进行修改,最后得到 10 分。

GStack 技术架构

  • 技能系统:基于 Markdown 提示文件,通过 Claude Code 的自定义命令功能集成
  • 浏览器自动化:基于 Playwright 构建持久化 Chromium 会话,支持 Cookie 导入和真实环境测试
  • 多平台支持:除 Claude Code 外,还支持 OpenAI Codex CLI、Cursor、OpenCode 等 8 种 AI 编码工具
  • 团队模式:支持全局安装和项目级安装,可配置自动更新,确保团队成员使用一致版本

GStack 适用人群

根据官方文档,GStack 特别适合

  • 创始人和 CEO — 尤其是希望亲自参与交付的技术型创始人
  • 首次使用 Claude Code 的用户 — 提供结构化角色,而非空白提示
  • 技术负责人和资深工程师 — 对每个 PR 进行严格审查、QA 和发布自动化

GStack 项目信息

GStack 的核心理念是:通过结构化的角色分工和审查流程,将 AI 辅助开发从模糊的通用对话升级为专业的工程工作流,帮助个人开发者或小型团队实现"一人成军"的开发效率

附录 GStack 角色定位

规划阶段

命令角色功能
/office-hoursCEO/产品经理起始点。通过 6 个强制性问题,在写代码前重新定义产品。挑战你的前提假设,提出替代方案。输出的设计文档会流向所有下游技能。
/plan-ceo-review首席执行官/创始人重新思考问题,找到隐藏在需求中的"10 星产品"。四种模式:扩展、选择扩展、保持范围、缩减。
/plan-eng-review工程经理锁定架构、数据流、图表、边界情况和测试。将隐藏的假设暴露出来。
/plan-design-review高级设计师给每个设计维度打 0-10 分,解释 10 分是什么样的,然后修改计划以达到目标。AI 低质内容检测。交互式——每个设计选择只问一个用户问题。
/plan-devex-review开发体验负责人交互式 DX 评估:探索开发者画像,对比竞品的 TTHW(首次上手时间),设计你的"魔法时刻",逐步追踪摩擦点。三种模式:DX 扩展、DX 打磨、DX 分诊。20-45 个强制性问题。
/autoplan评审流程一个命令,生成完整审核过的计划。自动运行 CEO → 设计 → 工程评审,仅将品味相关的决策提交你批准。

设计阶段

命令角色功能
/design-consultation设计合作伙伴从零构建完整的设计系统。研究市场环境,提出创意风险,生成逼真的产品模型。
/design-review会写代码的设计师执行与 /plan-design-review 相同的审核,然后修复发现的问题。原子提交,附带前后对比截图。
/design-shotgun设计探索器"给我看选项"。生成 4-6 个 AI 模型变体,在浏览器中打开对比板,收集反馈并迭代。品味记忆会学习你的偏好。重复直到满意,然后交给 /design-html
/design-html设计工程师将模型转化为真正能用的生产级 HTML。预计算布局:文本重排、高度自适应、动态布局。30KB,零依赖。自动检测 React/Svelte/Vue。针对设计类型(落地页/仪表盘/表单)智能路由 API。输出可直接上线,不是演示稿。

开发审查阶段

命令角色功能
/review资深工程师找出那些能通过 CI 但在生产环境爆炸的 bug。自动修复明显的问题。标记完整性缺口。
/investigate调试器系统化的根因调试。铁律:不调查就不修复。追踪数据流,验证假设,修复失败 3 次后停止。
/devex-reviewDX 测试员实时开发者体验审计。实际测试你的 onboarding:浏览文档,尝试入门流程,计时 TTHW,截图错误。与 /plan-devex-review 的评分对比——检验计划与现实的差距。

测试与质量保证

命令角色功能
/qaQA 负责人测试应用,发现 bug,用原子提交修复,重新验证。为每个修复自动生成回归测试。
/qa-onlyQA 记录员/qa 方法相同,但只报告不修复。纯 bug 报告,不改动代码。
/browseQA 工程师给 AI 装上眼睛。真实的 Chromium 浏览器,真实的点击,真实的截图。每条约 100ms。/open-gstack-browser 启动带侧边栏、反机器人隐身和自动模型路由的 GStack 浏览器。
/setup-browser-cookies会话管理器从真实浏览器(Chrome/Arc/Brave/Edge)导入 Cookie 到无头会话。用于测试需要登录的页面。

安全与合规

命令角色功能
/cso首席安全官OWASP Top 10 + STRIDE 威胁建模。零噪音:17 类误报排除,8/10+ 置信度门槛,独立发现验证。每个发现都包含具体的利用场景。

发布与部署

命令角色功能
/ship发布工程师同步主分支,运行测试,审计覆盖率,推送,开启 PR。如果没有测试框架,自动初始化。
/land-and-deploy发布工程师合并 PR,等待 CI 和部署,验证生产环境健康。一个命令从"已批准"到"生产环境已验证"。
/canarySRE部署后监控循环。监控控制台错误、性能回退和页面故障。
/benchmark性能工程师基线化页面加载时间、Core Web Vitals 和资源大小。对比每个 PR 的前后表现。
/document-release技术文档工程师更新所有项目文档以匹配刚发布的版本。自动识别过时的 README。

协作与多智能体

命令角色功能
/pair-agent多智能体协调员与任何 AI 智能体共享浏览器。一个命令,一次粘贴,即可连接。支持 OpenClaw、Hermes、Codex、Cursor 等。每个智能体独立标签页。自动启动有头模式以便观察。自动开启 ngrok 隧道供远程智能体使用。令牌作用域隔离、标签隔离、速率限制、活动归因。

复盘与学习

命令角色功能
/retro工程经理团队感知的每周复盘。人均细分、连续发布 streak、测试健康趋势、成长机会。/retro global 跨所有项目和 AI 工具(Claude Code、Codex、Gemini)运行。
/learn记忆管理 GStack 在会话间学到的内容。审核、搜索、修剪并导出项目特定的模式、陷阱和偏好。学习会跨会话累积,让 GStack 随着时间更懂你的代码库。
评论
  • 按正序
  • 按倒序
  • 按热度