Claude Code 안에서 OpenAI Codex 돌리기 — codex-plugin-cc 실사용 리뷰

"내가 짠 코드를 내가 리뷰하면 같은 맹점에 빠진다."

그래서 OpenAI가 Claude Code 안에 자기네 Codex를 박았다.

2026년 3월 말, OpenAI가 묘한 물건을 공식 릴리즈했다. Claude Code 안에서 슬래시 명령으로 Codex를 호출하는 플러그인이다. 경쟁사 도구 안에서 자기 모델을 돌리게 하다니 — 처음 들으면 약간 어이없다. 그런데 GitHub 별 4,000개를 일주일 만에 찍었다. 왜 핫한지, 실제 써보면 뭐가 좋고 뭐가 별로인지 정리해봤다.

TL;DR

뭐냐: Claude Code에서 /codex:review, /codex:adversarial-review, /codex:rescue 슬래시 명령으로 OpenAI Codex 호출
왜 쓰나: 같은 모델끼리 만든 sycophancy 편향(아부 편향) 우회 + Anthropic 한도 터졌을 때 lifeline
결론: 리뷰어로 쓰면 효자, rescue로 쓰면 보험. 단 false positive 필터링은 사람 몫.

1. 설치 (90초 컷)

Claude Code 터미널에서 슬래시 명령 4개:

/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
/reload-plugins
/codex:setup

필요한 것:

Node.js 18.18 이상
ChatGPT 구독 (Free 티어도 OK) 또는 OpenAI API 키
Codex 미인증이면 !codex login

설치하면 /codex: 로 시작하는 슬래시 명령 묶음이 생긴다.

2. 세 가지 핵심 명령

`/codex:review` — 표준 리뷰

중립적·읽기 전용. "이 코드가 뭘 하는지 + 명백한 문제"만 짚는다.

/codex:review --base main        # main 대비 diff 리뷰
/codex:review --background       # 백그라운드 실행

`/codex:adversarial-review` — 적대적 리뷰

"이 코드는 망가져 있다"고 가정하고 공격적으로 헌팅. Claude의 sycophancy bias 우회용으로 가장 가치 있다.

/codex:adversarial-review --base main challenge whether caching design is optimal

`/codex:rescue` — 작업 위임 (유일하게 코드 수정 가능)

리뷰가 아니라 태스크 핸드오프. 막혔을 때, Opus 한도 터졌을 때, 다른 시각이 필요할 때.

/codex:rescue investigate why tests are failing
/codex:rescue --model gpt-5.4-mini --effort medium fix flaky test
/codex:rescue --background --resume    # 이전 세션 이어받기

--background로 던지면 /codex:status, /codex:result, /codex:cancel로 관리.

3. 실제로 좋았던 점

진짜 버그를 잡는다 (구체 사례)

Nathan Onn의 후기를 보면 프로덕션 코드에서 edge case 4개를 잡았다:

silent failure
state overwrite
premature navigation
그 외 1건

같은 모델이 짜고 같은 모델이 본 코드엔 공통 맹점이 있다. 다른 프로바이더가 보면 다른 게 보인다. 특히:

보안 이슈 — 작성자 아닌 리뷰어일 때 더 잘 잡힘
로직 흐름 edge case — 다른 추론 스타일이 다른 걸 잡음

컨텍스트 전환 0

터미널 왔다갔다, 코드 복붙, 두 도구 인증 따로 — 다 사라진다. 리뷰가 코드 짠 자리에서 일어난다. 이게 생각보다 크다.

비용 분리 — Opus 한도 lifeline

Codex 호출은 ChatGPT 계정에 청구된다. Anthropic Opus 한도와 무관. Opus 한도 터지기 직전에 /codex:rescue --background fix the issue로 던지면 그대로 일이 굴러간다. 이게 진짜 매력 포인트 중 하나.

속도 적당

풀 UI 리디자인 리뷰 6분 35초. 빌드 + 리뷰 + 필터링 합쳐 ~10분 사이클.

4. 그런데 단점도 만만치 않다

❶ False positive 트리아지는 사람 몫

Nathan은 대놓고 적었다 — "맹목적으로 안 믿는다."

리뷰 결과 그대로 적용하면 불필요한 churn 생긴다. 그래서 본인은 별도 6줄 검증 프롬프트를 만들어서 Claude한테 시킨다:

"Codex 피드백을 맥락 분석하고, 판단 필요한 항목은 플래그하고, 질문부터 해."

즉 리뷰 결과 → 사람 판단 → 적용 사이에 추가 단계가 필요하다.

❷ Review Gate 토큰 무한 루프 함정

--enable-review-gate 옵션은 Claude ↔ Codex 자동 루프를 만든다. 듣기엔 멋진데 실제로는:

false positive 걸러주는 필터 없음
양쪽 사용량 동시 폭주
자리 비운 사이 한도 다 태움

⚠️ 세션 모니터링할 때만 켜라. 안 그러면 다음 날 일어나서 한도 터진 거 보고 슬프다.

❸ 멀티파일 리뷰 = 느림

큰 PR은 백그라운드 권장. /codex:status로 폴링해야 하니 즉답성은 떨어짐.

❹ Codex CLI 사전 셋업

Node 18.18+ + Codex CLI 별도 설치 + 인증. Claude Code만 쓰던 사람한텐 진입 마찰.

❺ Codex가 응답 스타일이 다르다

HN/Reddit 일반 여론은 대략 Claude Code 80% / Codex 20% 사용 비율. Codex는:

더 hands-off (자율 실행 선호)
응답 속도 Claude보다 느림
빠른 페어 코딩 왕복엔 답답

리뷰어로는 좋은데 /codex:rescue로 위임할 땐 호불호 갈린다.

❻ 정치적 어색함

경쟁사 도구 안에서 자사 모델 돌리는 플러그인이라 "Anthropic 코드가 별로라는 snarky 암시 아니냐" 같은 반응이 Threads에서 나왔다. 기술적 문제는 아닌데 사용자 입장에선 한 번쯤 의식되긴 한다.

5. 언제 쓰고 언제 안 쓸까

✅ 쓸 때

PR 올리기 직전 셀프 리뷰 — /codex:review --base main
보안 감사 / 적대적 검토 — /codex:adversarial-review focus on security
Opus 한도 임박 — /codex:rescue --background <지시>
Claude가 자기 코드에 자신만만할 때 의심 한 번 더

❌ 안 쓸 때 / 조심

Review gate 켜놓고 자리 비우기 — 한도 무한 소비
빠른 페어 코딩 — 속도 손해
false positive 걸러낼 시간 없을 때 — 오히려 churn 증가
Codex CLI 셋업이 부담 — 그냥 Claude만 써도 충분한 경우 多

6. 마무리 — 진짜 가치는 "다른 시각"

이 플러그인의 진짜 가치는 "OpenAI 모델이 더 좋다"가 아니다. "내 코드를 내가 못 본다"는 인지적 사실에 대한 우회로다.

LLM 코딩이 보편화되면서 같은 모델이 짠 걸 같은 모델이 리뷰하면 같은 맹점에 빠진다는 게 점점 분명해지고 있다. 다른 프로바이더의 다른 추론 스타일을 자동화된 두 번째 의견으로 끼워넣는 건 — 적어도 보안과 edge case 측면에선 — 측정 가능한 가치를 만든다.

다만 노이즈 트리아지는 여전히 사람 몫이다. AI 리뷰어를 추가했다고 사람의 판단이 빠지는 게 아니라, 사람이 봐야 할 신호의 양이 늘어난 거다. 거기에 맞는 워크플로(검증 프롬프트, review gate 끄기 등)를 같이 세팅해야 효자가 된다.

한 번 깔아볼만하다. 단, review gate는 처음 며칠 끄고 시작할 것을 강력 추천한다.

부록: 명령 치트시트

상황	명령
표준 셀프 리뷰	`/codex:review --base main`
적대적 리뷰 (보안 감사)	`/codex:adversarial-review focus on security`
작업 위임 (Opus 한도)	`/codex:rescue --background <지시>`
빠른 패스 (저비용)	`/codex:rescue --model gpt-5.4-mini --effort low`
백그라운드 진행 확인	`/codex:status` / `/codex:result`
작업 취소	`/codex:cancel [task-id]`

참고 자료:

📌 함께 보면 좋은 글

저작자표시 비영리 변경금지 (새창열림)

'AI.IT' 카테고리의 다른 글

WebMCP 실전 적용, AI 에이전트가 내 웹사이트를 직접 쓸 수 있게 만드는 전략 (1)	2026.05.08
MCP 에이전트 자동화, Claude Opus 4.7이 GPT-5.4보다 나은 딱 한 가지 (0)	2026.05.07
Google Antigravity 써봤는데, 무료라는 말과 실제 할당량이 달랐다 (2)	2026.05.06
Lovable vs Bolt.new vs v0, 바이브코딩 앱 빌더 직접 써본 결과 정리 (2)	2026.05.05
OpenAI Symphony, 티켓에 라벨 하나 달았더니 4분 만에 PR이 왔다 (3)	2026.05.04

KnightK

Claude Code에 OpenAI Codex 박기: codex-plugin-cc 실사용 장단점 정리

Claude Code 안에서 OpenAI Codex 돌리기 — codex-plugin-cc 실사용 리뷰

TL;DR

1. 설치 (90초 컷)

2. 세 가지 핵심 명령

`/codex:review` — 표준 리뷰

`/codex:adversarial-review` — 적대적 리뷰

`/codex:rescue` — 작업 위임 (유일하게 코드 수정 가능)

3. 실제로 좋았던 점

진짜 버그를 잡는다 (구체 사례)

컨텍스트 전환 0

비용 분리 — Opus 한도 lifeline

속도 적당

4. 그런데 단점도 만만치 않다

❶ False positive 트리아지는 사람 몫

❷ Review Gate 토큰 무한 루프 함정

❸ 멀티파일 리뷰 = 느림

❹ Codex CLI 사전 셋업

❺ Codex가 응답 스타일이 다르다

❻ 정치적 어색함

5. 언제 쓰고 언제 안 쓸까

✅ 쓸 때

❌ 안 쓸 때 / 조심

6. 마무리 — 진짜 가치는 "다른 시각"

부록: 명령 치트시트

📌 함께 보면 좋은 글

'AI.IT' 카테고리의 다른 글

티스토리툴바

Claude Code에 OpenAI Codex 박기: codex-plugin-cc 실사용 장단점 정리

Claude Code 안에서 OpenAI Codex 돌리기 — codex-plugin-cc 실사용 리뷰

TL;DR

1. 설치 (90초 컷)

2. 세 가지 핵심 명령

/codex:review — 표준 리뷰

/codex:adversarial-review — 적대적 리뷰

/codex:rescue — 작업 위임 (유일하게 코드 수정 가능)

3. 실제로 좋았던 점

진짜 버그를 잡는다 (구체 사례)

컨텍스트 전환 0

비용 분리 — Opus 한도 lifeline

속도 적당

4. 그런데 단점도 만만치 않다

❶ False positive 트리아지는 사람 몫

❷ Review Gate 토큰 무한 루프 함정

❸ 멀티파일 리뷰 = 느림

❹ Codex CLI 사전 셋업

❺ Codex가 응답 스타일이 다르다

❻ 정치적 어색함

5. 언제 쓰고 언제 안 쓸까

✅ 쓸 때

❌ 안 쓸 때 / 조심

6. 마무리 — 진짜 가치는 "다른 시각"

부록: 명령 치트시트

📌 함께 보면 좋은 글

'AI.IT' 카테고리의 다른 글

관련글

티스토리툴바

`/codex:review` — 표준 리뷰

`/codex:adversarial-review` — 적대적 리뷰

`/codex:rescue` — 작업 위임 (유일하게 코드 수정 가능)