본문 바로가기
AI.IT

금융 AI 신뢰 문제, Kepler가 찾은 해답은 Claude와 검증 레이어 분리

by bamsik 2026. 5. 20.
반응형

AI 출력을 믿지 못해서 실무에 못 쓰겠다는 말, 금융권에서는 특히 많이 나온다. 데이터 하나 틀리면 수억짜리 판단이 흔들리는 구조다 보니 당연한 얘기긴 한데, Kepler라는 회사가 이걸 좀 다른 방식으로 풀었다.

147개 금융사, 같은 말만 들었다

Kepler 창업자들이 회사 만들기 전에 금융사 147곳 인터뷰를 했단다. 결과는 거의 똑같았다. "AI로 리서치 하고 싶은데, 출력을 신뢰 못하겠다"는 것.

사실 이 문제가 LLM의 근본적인 한계다. 잘 모르면 그냥 그럴듯하게 지어내는 경향이 있고, 특히 숫자나 재무 데이터는 환각(hallucination)이 치명적이다. 투자 리서치 애널리스트 입장에서는 보고서에 숫자 하나 틀리면 바로 신뢰 문제가 된다.

근데 Kepler가 찾은 해답이 흥미롭다. AI를 더 정확하게 만들려고 한 게 아니라, 아예 구조를 나눠버렸다.

두 레이어 분리 — 이게 핵심이다

Kepler의 아키텍처는 단순하다.

하나는 결정론적 인프라. SEC 공시 2,600만 건, 공개 문서 5,000만 건, 비공개 문서 100만 건 이상을 인덱싱해 뒀다. 27개 글로벌 마켓, 14,000개 이상 기업이 대상이다. 여기서는 숫자가 어디서 왔는지, 원본 문서의 정확히 어느 라인인지까지 추적 가능하다.

다른 하나는 Claude. 애널리스트가 영어로 질문하면 Claude가 의미를 해석하고, Kepler 인프라에서 검증된 데이터를 뽑아오는 구조다.

쉽게 말하면, "해석은 AI가, 숫자는 원본에서"라는 식이다. Claude가 틀릴 수 있는 영역을 결정론적 검증으로 막아버린 거다.

실제로 어떻게 쓰나

써봤냐고 하면 나는 직접은 못 해봤는데, 발표된 내용을 보면 꽤 구체적이다.

애널리스트가 "이 회사 3개년 영업이익 변화 보여줘"라고 물으면, Claude가 질문을 파싱하고, Kepler가 검증된 SEC 공시에서 해당 수치를 뽑아서, 기존에 쓰던 Excel 템플릿에 자동으로 채워준다. 그리고 각 숫자마다 원본 공시 문서의 정확한 위치까지 연결된다.

감사 추적(audit trail)이 완벽하게 남는다는 거다. 금융 규제 환경에서 이게 얼마나 중요한지는 굳이 설명 안 해도 될 것 같다.

확장 가능성이 더 재밌다

Kepler 팀이 밝힌 더 큰 그림은 금융 너머다. 의료는 임상시험 데이터 vs 치료 프로토콜, 법률은 수십 년치 판례 추적 — "검증 가능한 답변이 필요한 모든 곳"에 같은 구조를 쓸 수 있다는 얘기다.

솔직히 이건 맞는 방향이라고 본다. AI 환각 문제를 모델 자체에서 해결하려는 시도는 계속 있었는데, 성능은 올라가도 완전히 없애긴 어렵다. 반면 Kepler 방식은 "AI가 틀릴 수 있는 영역"을 애초에 구조적으로 격리시키는 거라 훨씬 현실적이다.

아쉬운 점도 있다

한계도 있다. 결국 Kepler 인프라에 없는 데이터는 답을 못 한다. 26M개 공시가 있어도 그 안에 없는 내용이나, 아직 인덱싱 안 된 최신 문서는 빈 곳이다. 그리고 비공개 문서 100만 건이라고 해도, 기업마다 내부 데이터 연동은 별도 구축이 필요할 거다.

가격도 공개 안 돼 있어서 소규모 운용사나 개인 투자자가 쓸 수 있는 수준인지는 모르겠다.

그래도 "AI 출력을 어떻게 믿게 만들 것인가"라는 질문에 대한 답으로는 지금까지 본 것 중에 가장 현실적인 접근이다. 앞으로 이런 구조를 가진 버티컬 AI 플랫폼이 많이 나올 것 같다는 느낌이다.


📌 함께 보면 좋은 글

반응형