본문 바로가기
AI.IT

Meta Muse Spark 출시됐는데, 143억 달러 투자한 AI가 왜 실망이라 불리나

by bamsik 2026. 4. 12.
반응형

메타가 드디어 Muse Spark를 내놨다. Meta Superintelligence Labs에서 만든 첫 번째 대형 언어 모델이다. 출시 직후 SNS에 "실망이다", "이게 143억 달러짜리냐"는 반응이 쏟아졌는데, 정작 내용을 뜯어보면 그렇게 단순하지 않다.

알렉산더 왕이 9개월 만에 내놓은 첫 번째 모델

Muse Spark의 배경부터 보면, 메타는 지난해 알렉산더 왕(Alexandr Wang)을 Chief AI Officer로 영입했다. 왕은 29살에 Scale AI를 공동 창업한 사람으로, 메타는 그를 데려오면서 데이터 레이블링 사업에 143억 달러(약 20조 원)를 투자했다. 이 팀이 약 9개월 만에 내놓은 모델이 Muse Spark, 코드명 Avocado다.

모델은 현재 메타 AI 어시스턴트에 탑재돼 있다. ChatGPT, Claude와 직접 경쟁하는 포지션이고, 메타 측은 Llama 4에서 "완전히 밑바닥부터 다시 만들었다"고 강조했다. 인스타그램, 왓츠앱, 페이스북 앱에서 메타 AI를 써봤다면 이미 Muse Spark를 경험한 거다.

실망이라는 평가, 왜 나왔나

출시 직후 "실망"이라는 단어가 따라붙었다. 근거는 단순하다. 벤치마크 숫자다. MMLU, GPQA 같은 학술 평가에서 GPT-5.4나 Gemini 3.1보다 낮은 점수가 나왔다. 143억 달러를 쏟은 것치고 1등이 아니라는 게 핵심이다.

그런데 알렉산더 왕 본인이 이걸 인정했다. "특정 벤치마크에서 잘 못 한다는 걸 처음부터 솔직하게 밝혔다"는 게 그의 답변이었다. 사실 이 발언이 오히려 인상적이었다. 다른 AI 회사들이 발표할 때마다 "세계 최고 수준"을 강조하는 것과 달리 처음부터 한계를 인정하는 방식이 좀 낯설었다.

직접 대화를 몇 가지 돌려봤는데, 짧고 빠른 응답이 필요한 일상 대화에서는 확실히 자연스럽다. 긴 문서 요약이나 코딩 작업에서는 Claude나 GPT에 비해 밀리는 게 느껴졌다. 범용 LLM보다는 소셜 미디어 맥락 특화 쪽에 가깝다는 인상이다.

개발자가 신경 써야 할 부분

API 접근은 현재 제한적이다. Llama 4까지는 오픈소스로 공개했는데, Muse Spark는 그 방향이 아니다. 적어도 지금은. 오픈소스 생태계에 기여해왔던 메타의 행보와 다른 선택이라, 커뮤니티 반응이 복잡하다. 일부는 "상업적 압박 때문"이라고 해석하고, 일부는 "어차피 Llama 시리즈는 계속 나온다"는 입장이다.

한 가지 더 보면, 멀티모달 처리 능력이다. 이미지와 영상 입력을 텍스트와 함께 처리하는 구조가 Llama 4보다 개선됐다고 메타는 밝혔다. 인스타그램 피드 이해, 릴스 자동 설명 같은 기능에 붙이기 좋은 방향이다. 메타 앱 안에서 AI 기능을 개발하는 팀이라면 이쪽이 실질적으로 관련이 있다.

다음 버전이 진짜 시험대다

솔직히, 현재 Muse Spark는 투자 규모 대비 기대치를 밑돈다는 평가가 틀리지 않는다. 143억 달러는 어마어마한 숫자이고, 9개월이라는 시간은 짧지 않다. 그럼에도 1등 자리를 차지하지 못했다.

그런데 이게 꼭 실패를 의미하진 않는다. 데이터 레이블링에 그 규모를 쏟은 건 다음 세대 모델을 위한 토대일 수 있다. 알렉산더 왕 팀이 9개월 만에 첫 모델을 내놓은 걸 어떻게 볼지는, 다음 Muse 시리즈가 어떻게 나오느냐로 판단이 달라질 거다. 지금 Muse Spark는 시작점이라고 보는 게 맞다. 아쉬운 시작점이긴 하지만.


📎 참고 자료


📌 함께 보면 좋은 글

반응형