main-logo

gstack

Y Combinator CEO가 만든 1인 가상 개발팀

profile
doworld
2026년 03월 22일 · 0 분 소요

들어가며

Y Combinator의 CEO Garry Tan이 50일 동안 주당 10,000줄의 코드를 쓰고, 100개의 PR을 처리했다. 혼자서.

비결은 Claude Code에 올린 오픈소스 스킬 팩 하나였다. gstack. Claude Code를 CEO, 디자이너, 엔지니어링 매니저, 시니어 개발자, QA, 릴리스 엔지니어, 보안 담당자가 있는 가상 개발팀으로 바꿔주는 도구다.

 

gstack이란?

gstack은 Claude Code용 21개의 슬래시 명령어(스킬) 모음이다. 각 명령어가 소프트웨어 개발 팀의 특정 역할을 수행한다. (계속 업데이트 중이라 더 많아질 수 있다.)

핵심 철학은 단순하다: 개발자 한 명이 해야 할 기획, 설계, 구현, 리뷰, QA, 배포, 회고를 각각 다른 전문가 모드로 실행하면, 한 명이 팀처럼 일할 수 있다.

SaaS도 아니고, 구독도 없고, 텔레메트리도 없다. 마크다운 스킬 파일과 컴파일된 바이너리 하나로 구성된 MIT 라이선스 오픈소스다. 모든 스킬 파일을 직접 읽고 수정할 수 있다.

 

gstack이 이렇게 빠르게 주목받은 이유의 절반은 도구 자체가 아니라 만든 사람에 있다.

Garry Tan(YC CEO)은 실리콘밸리에서 가장 영향력 있는 인물 중 하나다.

  • Y Combinator(YC) 현 CEO/사장 — 세계에서 가장 유명한 스타트업 액셀러레이터. Airbnb, Dropbox, Stripe, Reddit, Coinbase를 배출한 곳이다.
  • Initialized Capital 공동 창업 — 시드 단계 VC 펀드
  • Palantir 초기 엔지니어 — 실리콘밸리의 전설적인 데이터 분석 기업
  • Posterous 공동 창업자 — 블로그 플랫폼 (Twitter에 인수)

VC이자 경영인이지만, 여전히 직접 코드를 쓰는 현역 빌더다. gstack은 그가 실제로 50일간 매일 사용하면서 만든 도구이고, 주당 10,000줄의 코드와 100개의 PR이라는 구체적 수치를 공개했다.

YC CEO가 "AI로 혼자 팀처럼 일한다"는 스토리 자체가 강력했다. 도구의 기술력에 대한 평가와 별개로, "누가 만들었고, 실제로 어떤 성과를 냈는가"가 바이럴의 핵심이었다.

 

설치

git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host auto

요즘은 설치 방법도 이제 그리 중요하지 않다.

https://github.com/garrytan/gstack

레포지토리 주소를 claude code에게 전달하며 설치하라고 하면 끝난다.

 

21개의 스킬: 역할별 정리

기획 (Planning)

/office-hours — YC 파트너 모드

아이디어나 요청을 받으면 바로 코딩하지 않고, YC 오피스 아워처럼 전제를 검증한다. "이게 진짜 사용자가 원하는 건가?" "더 좋은 접근은 없나?" 스타트업 모드와 빌더 모드를 제공한다.

/office-hours "사용자가 비밀번호를 자주 잊어버린다는 CS 피드백이 있어"

→ "비밀번호 리셋 기능보다 소셜 로그인 도입이 근본 해법일 수 있습니다."
→ "현재 리셋 이메일 도달률이 30%입니다. SMS 인증을 고려하세요."
→ 선택지 제시: 범위 확대 / 현상 유지 / 축소

 

/plan-ceo-review — CEO/창업자 모드

평범한 티켓 안에 숨어 있는 10점짜리 제품을 찾는다. 기술이 아니라 제품 관점에서 사고한다.

 

/plan-eng-review — 엔지니어링 매니저 모드

아키텍처, 데이터 흐름, 상태 전환, 장애 모드, 엣지 케이스를 ASCII 다이어그램으로 시각화한다. 코드를 쓰기 전에 숨겨진 가정과 위험을 드러낸다.

/plan-eng-review "결제 API에 쿠폰 기능 추가"

→ 데이터 흐름 다이어그램 생성
→ "부동소수점 연산에서 0원 결제 가능성 발견"
→ "동시 쿠폰 적용 시 race condition 위험"
→ "쿠폰 코드 입력 필드에서 XSS 공격 가능성"

 

디자인 (Design)

/plan-design-review — 시니어 디자이너 모드

기획 단계의 UI/UX 감사. 정보 구조, 상호작용 상태, AI 슬롭 위험도를 0~10점으로 평가한다.

 

/design-consultation — 디자인 파트너 모드

제품의 완전한 디자인 시스템을 구축한다. 타이포그래피, 컬러 팔레트, 간격 스케일을 제시하면서 "안전한 선택 vs 창의적 위험"을 구분해준다.

 

/design-review — 코딩 디자이너 모드

실제 사이트를 80개 항목으로 시각 감사한다. CSS 전용 수정을 원자적 커밋으로 적용하고, 전후 스크린샷을 제공한다.

 

개발 & 리뷰 (Development & Review)

/review — 시니어 엔지니어 모드

"테스트는 통과하지만 프로덕션에서 폭발할 버그"를 잡는다. N+1 쿼리, 경합 상태, 신뢰 경계 문제를 탐지하고 자동 수정하거나 플래그한다.

 

/investigate — 디버거 모드

체계적 근본 원인 분석. 데이터 흐름을 추적하고, 가설을 세우고, 검증한다. 세 번 실패하면 아키텍처 자체를 재검토한다.

 

/codex — 이차 검토자 모드

OpenAI Codex CLI를 호출하여 독립적인 코드 리뷰를 받는다. Claude가 쓴 코드를 Codex가 검토하는 크로스 체크. 통과/실패 게이트와 대립적 도전을 포함한다.

 

QA & 브라우저 (Quality Assurance)

/qa — QA 리더 모드

변경된 코드가 영향을 미치는 페이지를 자동으로 식별하고 테스트한다. 버그 수정 후 회귀 테스트를 자동 생성한다. Diff 감지, 전체, 빠른, 회귀 네 가지 모드를 제공한다.

 

/browse — QA 엔지니어 모드 (영구 브라우저)

gstack의 가장 독특한 기능이다. 일반적으로 AI가 브라우저를 조작하면 매번 새로 열어서 호출당 3~5초가 걸린다. gstack은 Chromium을 데몬으로 상시 실행하여 호출당 100~200ms로 줄였다.

일반 AI 브라우저 호출:
  매번 Chromium 실행 → 페이지 로드 → 작업 → 종료 → 3~5초/호출

gstack 영구 브라우저:
  Chromium 데몬 상시 실행 → localhost HTTP 통신 → 100~200ms/호출
  쿠키, localStorage, 로그인 상태가 유지됨

이 덕분에 로그인이 필요한 페이지도 테스트할 수 있고, QA 자동화 속도가 비약적으로 빨라진다.

 

/setup-browser-cookies — 세션 관리자 모드

Chrome, Arc, Brave, Edge에서 쿠키를 가져와서 영구 브라우저에 주입한다. 인증이 필요한 페이지를 테스트할 때 필수적이다.

 

보안 & 배포 (Security & Shipping)

/cso — 보안 담당자 모드

OWASP Top 10 + STRIDE 위협 모델링. 주입, 인증, 암호, 접근 제어 문제를 스캔한다.

 

/ship — 릴리스 엔지니어 모드

한 명령어로 배포까지:

/ship

→ main 브랜치 동기화
→ 전체 테스트 스위트 실행
→ 테스트 커버리지 감사
→ PR 자동 생성
→ "PR #247 생성 완료"

테스트 프레임워크가 없으면 자동으로 부트스트랩해준다.

 

/document-release — 기술 작가 모드

배포 후 모든 프로젝트 문서를 자동 업데이트. 오래된 README를 감지하고 수정한다.

 

회고 (Retrospective)

/retro — 엔지니어링 매니저 모드 (회고)

커밋 히스토리를 분석하여 주간 회고를 자동 생성한다.

/retro

→ "이번 주 커밋 47건, PR 12건 머지"
→ "계획: 결제 쿠폰, 사용자 프로필, 검색 개선"
→ "완료: 결제 쿠폰 ✅, 사용자 프로필 ✅"
→ "미완: 검색 개선 (30%, 인덱싱 이슈)"
→ "다음 주 권장: 검색 인덱싱 최적화 우선"
→ 팀 인식: 개인별 기여도, 배포 스트릭, 테스트 상태 추세

 

안전 가드레일 (Safety)

/careful — 파괴적 명령 전 경고 (`rm -rf`, `DROP TABLE` 등)

/freeze — 특정 디렉토리로만 편집 범위 제한

/guard/careful + /freeze 결합. 최대 안전 모드.

/unfreeze — 편집 제한 해제

/gstack-upgrade — gstack 자체를 최신 버전으로 업그레이드

 

실전 워크플로우: 새 기능을 기획부터 배포까지

Step 1: 아이디어 검증
/office-hours "사용자가 상품 검색이 너무 느리다고 함"
  → "검색 속도 개선보다, 검색 결과 품질이 핵심 문제일 수 있습니다"
  → 방향 합의

Step 2: 제품 리뷰
/plan-ceo-review
  → "자동완성 + 최근 검색어 조합이 10점짜리 경험"
  → 범위 확정

Step 3: 엔지니어링 리뷰
/plan-eng-review
  → 아키텍처 다이어그램 생성
  → "Elasticsearch 인덱스 전략 필요"
  → "한글 형태소 분석기 nori 플러그인 추가 필요"

Step 4: 디자인 리뷰
/plan-design-review
  → UI/UX 감사
  → "자동완성 드롭다운의 접근성 문제 발견"

Step 5: 구현 (일반 Claude Code 사용)

Step 6: 코드 리뷰
/review
  → "검색 쿼리 입력에 XSS 취약점"
  → "N+1 쿼리 문제: 검색 결과 100건 이상에서 지연"
  → 자동 수정 적용

Step 7: 보안 검토
/cso
  → OWASP Top 10 스캔
  → "검색어 로깅에서 PII 노출 위험"

Step 8: QA
/qa
  → 변경 영향 페이지 자동 식별
  → 검색 결과, 자동완성, 필터 테스트 실행
  → 회귀 테스트 자동 생성

Step 9: 시각적 검증
/browse
  → 영구 브라우저에서 실제 화면 확인
  → 스크린샷 캡처
  → "자동완성 드롭다운 정상 표시 확인"

Step 10: 배포
/ship
  → main 동기화 → 테스트 → PR 생성

Step 11: 문서 업데이트
/document-release
  → README, API 문서 자동 업데이트

Step 12: 회고
/retro
  → 이번 주 성과 정리

12단계가 길어 보이지만, 각 단계는 슬래시 명령어 한 줄이다. 수동으로 했으면 여러 명이 며칠에 걸쳐 할 일을 혼자서 하루 안에 처리할 수 있다.

 

영구 브라우저: gstack의 킬러 피처

gstack의 다른 스킬들은 (솔직히) 다른 플러그인에서도 비슷하게 할 수 있다. 하지만 영구 브라우저(Persistent Browser)는 gstack만의 독보적인 기능이다.

왜 중요한가

AI 에이전트가 웹 페이지를 확인하려면 브라우저가 필요하다. 기존 방식은:

매 호출마다:
  Chromium 실행 (1~2초) → 페이지 로드 (1~2초) → 작업 → 종료
  = 호출당 3~5초

QA에서 20개 페이지를 확인하면 1~2분이 걸린다. 로그인이 필요한 페이지라면 매번 로그인을 다시 해야 한다.

 

gstack의 영구 브라우저:

최초 1회:
  Chromium 데몬 실행 (3~5초)

이후 모든 호출:
  localhost HTTP 통신 → 100~200ms
  쿠키, localStorage, 로그인 상태 유지

20개 페이지를 확인하는 데 2~4초. 25배 빠르다. 그리고 로그인 상태가 유지되니까 인증이 필요한 관리자 페이지도 바로 테스트할 수 있다.

 

논란

gstack은 출시 직후 개발자 커뮤니티에서 찬반 논쟁을 불러일으켰다. TechCrunch가 "왜 Garry Tan의 Claude Code 셋업이 그렇게 많은 사랑과 미움을 받는가"라는 기사를 쓸 정도였다.

긍정 측:

  • "혼자서 팀처럼 일할 수 있는 현실적인 셋업"
  • "영구 브라우저 아이디어가 천재적"
  • "YC CEO가 실제로 50일간 쓰면서 검증한 실전 도구"

부정 측:

  • "주당 10,000줄이 품질 있는 코드인지는 의문"
  • "AI 슬롭(AI가 만든 저품질 코드)을 대량 생산하는 도구 아닌가"
  • "리뷰와 QA도 AI가 하면, 누가 진짜 품질을 보장하는가"

이 논쟁은 gstack만의 문제가 아니다. AI 에이전트 시대에 "얼마나 빨리 만드느냐"와 "얼마나 잘 만드느냐" 사이의 긴장은 모든 도구가 안고 있는 과제다.

 

마치며: 1인 개발팀이라는 가능성

gstack이 보여주는 것은 개발이라는 행위가 "코드를 쓰는 것"만이 아니라는 사실이다. 기획하고, 설계하고, 리뷰하고, 테스트하고, 배포하고, 회고하는 전 과정이 개발이다. 전통적으로 이건 팀이 필요한 일이었다.

gstack은 이 각각의 단계를 슬래시 명령어 하나로 만들었다. CEO의 시각으로 기획하고(/plan-ceo-review), 시니어 엔지니어의 엄격함으로 리뷰하고(/review), QA 리더의 체계로 테스트하고(/qa), 릴리스 엔지니어의 자동화로 배포한다(/ship).

우리는 AI 리뷰가 사람 리뷰를 완전히 대체할 수는 없고 완벽하지 않다는 것을 이미 알고 있다. 

Garry Tan이 50일간 증명한 것은 도구의 완성도가 아니라, 1인 개발팀이라는 가능성 아닐까?

 

 

 

참고 자료

- gstack GitHub

- gstack 공식 사이트

- gstack Skills 문서

MarkTechPost — Garry Tan Releases gstack

- TechCrunch — gstack의 사랑과 미움