본문 바로가기
AI.IT

Microsoft가 자체 AI 모델 3종을 냈다, OpenAI 있는데 왜?

by bamsik 2026. 4. 4.
반응형

Microsoft가 왜 자체 AI 모델을 만드나?

OpenAI에 13조 원 넘게 투자해놓고, 자체 AI 모델을 내놓는다고? 처음엔 좀 이상했다. 파트너한테 돈 쏟아부으면서 동시에 경쟁 제품을 만드는 게 무슨 전략인가 싶었거든. 근데 이번에 나온 MAI 모델 3종을 보고 나니까 생각이 좀 달라졌다.

4월 2일, Microsoft AI 팀이 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 각각 음성 전사, 음성 생성, 이미지 생성 모델이다. 세 개 다 Microsoft Foundry 플랫폼에서 쓸 수 있고, MAI Playground에서도 테스트할 수 있다.

모델별로 뭘 하는지 간단하게

MAI-Transcribe-1은 25개 언어의 음성을 텍스트로 바꿔준다. Microsoft 자체 Azure Fast 서비스보다 2.5배 빠르다고 한다. 가격은 시간당 $0.36. 회의록 자동 생성이나 실시간 자막 같은 데 쓸 수 있을 것 같다.

MAI-Voice-1은 텍스트를 음성으로 만드는 모델인데, 60초 오디오를 1초 만에 생성한다는 게 인상적이다. 커스텀 음성도 만들 수 있다고. 100만 글자당 $22 수준.

MAI-Image-2는 사실 3월 19일에 먼저 공개됐던 건데, 이번에 Foundry에 정식으로 올라왔다. 텍스트 입력 100만 토큰당 $5, 이미지 출력 100만 토큰당 $33이다.

가격 전쟁을 노리는 건가

솔직히 기능 자체가 엄청 독특한 건 아니다. 음성 전사, TTS, 이미지 생성은 Google이나 OpenAI도 다 하는 거니까. 근데 Microsoft가 강조하는 포인트는 가격이다. 블로그 포스트에서 대놓고 "Google과 OpenAI보다 저렴하다"고 썼거든.

이 전략이 먹힐 수 있는 이유가 있다. 엔터프라이즈 고객 입장에서 AI 모델 비용은 점점 커지는 문제다. 매달 수십억 토큰을 처리하는 회사라면 토큰당 단가 차이가 꽤 크게 느껴진다. Microsoft Foundry에 이미 인프라가 있는 기업이라면 굳이 다른 데 갈 이유가 줄어드는 거다.

OpenAI랑은 괜찮은 거야?

이게 좀 웃긴 부분인데. Mustafa Suleyman(Microsoft AI CEO)이 VentureBeat 인터뷰에서 "OpenAI와의 파트너십은 여전히 중요하다"고 했다. 근데 The Verge 인터뷰에서는 최근 재협상을 통해 자체 초지능 연구를 본격적으로 추진할 수 있게 됐다고 했거든.

쉽게 말하면, 예전엔 OpenAI 모델을 그냥 가져다 쓰는 위치였는데, 이제는 자체 모델도 병행하겠다는 거다. NVIDIA 칩도 자체 개발하면서 동시에 외부에서 사는 것처럼, AI 모델도 같은 전략인 셈이다.

써봐야 알겠지만, 방향은 맞아 보인다

아직 직접 프로덕션에 넣어본 건 아니라 성능을 단정할 순 없다. 근데 전반적인 방향은 꽤 합리적이라고 본다. 특히 Transcribe 모델의 속도 개선은 실시간 처리가 필요한 서비스에서 의미 있을 것 같고.

한 가지 아쉬운 건, 현재 Foundry 플랫폼에서만 쓸 수 있다는 점이다. Azure 생태계에 이미 들어와 있는 기업이 아니면 진입 장벽이 좀 있다. 오픈소스로 풀거나 API를 좀 더 열어주면 채택률이 훨씬 올라갈 텐데, 그건 Microsoft 스타일이 아니긴 하지.

어쨌든 AI 모델 시장이 점점 더 재밌어지고 있다. OpenAI, Google, Meta에 이어 Microsoft까지 자체 모델로 뛰어든 상황. 개발자 입장에서는 선택지가 늘어나는 게 나쁠 건 없다.


📎 참고 자료

반응형