본문 바로가기
ai

MiniMax M2.7 써보니, 스스로 진화한다는 게 반은 사실이었다

by bamsik 2026. 3. 24.
반응형

처음엔 그냥 또 하나의 AI 모델인 줄 알았다

MiniMax M2.7 출시 소식을 처음 봤을 때 솔직히 별 기대가 없었다. ChatGPT도 있고 Claude도 있고 Gemini도 있는데, 중국 스타트업 모델이 뭘 더 해줄 수 있겠어 싶었거든. 근데 좀 더 읽다 보니 뭔가 달랐다.

"모델이 스스로 학습한다"는 문장이 계속 눈에 걸렸다.

자가진화가 실제로 뭘 의미하냐면

MiniMax M2.7의 가장 큰 특징은 이전 버전의 모델이 자기 훈련 과정에 직접 참여했다는 거다. 그러니까 M2.7을 학습시키기 위한 데이터 파이프라인, 훈련 환경, 평가 인프라 구축에 이전 M2 계열 모델이 에이전트로 투입됐다고 한다.

단순히 "AI가 AI를 만든다"는 마케팅 문구가 아니라, 강화학습 연구 워크플로우의 30~50%를 M2.7 자체가 수행할 수 있다고 VentureBeat 보도에서 나왔다. 실제로 써보니 복잡한 코드 리팩토링 요청에서 이전 모델들보다 확실히 컨텍스트를 더 잘 유지하는 느낌이었다.

SWE-Pro 56%라는 수치가 뭘 의미하나

코딩 벤치마크인 SWE-Pro에서 56.22%를 기록했다. 이게 높은 건지 낮은 건지 감이 안 오는 분들을 위해 말하자면, Claude Opus 4.6이나 GPT-5.4와 거의 비슷한 수준이다. 근데 가격은 완전히 다른 차원이다.

  • Claude Sonnet 4.6: 입력 $3 / 백만 토큰
  • GPT-5.4: 입력 $2.50 / 백만 토큰
  • MiniMax M2.7: 입력 $0.30 / 백만 토큰

단순 계산으로도 10배 차이다. 처리 속도도 100 TPS(초당 토큰)라고 하니 느리지도 않다.

오피스 문서 편집 능력이 많이 개선됐다고 하는데, Excel/PPT/Word 멀티라운드 수정을 더 잘 처리한다고 한다. 국내에서 많이 쓰는 용도 아닌가 싶긴 한데 한국어 품질은 직접 더 써봐야 알 것 같다.

아쉬운 점도 있다

좋아 보이는 것만 쓰면 광고가 되니까. 솔직히 말하면 MiniMax는 아직 인지도가 낮다. 커뮤니티도 작고, 플러그인 생태계도 Claude나 GPT에 비하면 초라한 수준이다. API 안정성도 아직 검증이 덜 됐고, 한국어 벤치마크 자료도 거의 없다.

에이전트 태스크 중심으로 설계된 모델이라서 일반 챗봇 용도로는 오히려 오버스펙일 수도 있다. 반복적인 데이터 처리나 코딩 에이전트 용도로 API 비용 절감이 목표인 팀한테는 진지하게 검토해볼 만하다. 그냥 궁금해서 써보는 용도라면 굳이 서두를 필요는 없다.

결국 어떤 상황에 써볼 만하냐면

대규모 LLM API 호출이 필요한 프로젝트, 비용이 병목인 팀, 에이전트 아키텍처로 자동화를 구축하는 경우. 이런 상황이라면 M2.7 테스트해볼 가치가 있다. API 키 발급은 minimax.io에서 바로 할 수 있고, 한국에서도 접근 제한은 없다.

뭔가 거창한 결론이 있을 줄 알았는데, 사실 그냥 "가격 대비 성능이 꽤 된다"가 핵심이다. 자가진화라는 표현은 반은 사실이고 반은 마케팅이지만, 그 방향성 자체는 흥미롭다.


📎 참고 자료

반응형