
Copilot에서 로컬 모델 쓸 수 있게 됐다고?
VS Code에서 GitHub Copilot Chat 열어놓고 작업하다가, 모델 선택 드롭다운에 뭔가 달라진 걸 발견했다. Ollama가 붙었다. 진짜로. 로컬에서 돌리는 LLM을 Copilot Chat에서 바로 쓸 수 있게 된 거다.
사실 이전에도 Continue 같은 확장 프로그램으로 로컬 모델을 IDE에 연결하는 방법은 있었는데, 설정이 번거롭고 Copilot이랑 따로 놀았다. 근데 이제 Copilot 자체 모델 피커에서 Ollama를 선택할 수 있다. 이건 좀 다른 얘기다.

왜 로컬 모델이 필요한 건데
클라우드 API가 있는데 왜 굳이 로컬에서 돌리냐고? 몇 가지 시나리오가 확실히 있다.
- 오프라인 환경: 비행기, 보안 네트워크, VPN 끊겼을 때도 AI 지원을 받을 수 있다
- 보안/프라이버시: 회사 코드를 외부 API로 보내기 꺼려지는 경우. 실제로 금융권이나 공공기관에서 이 이유로 Copilot 도입을 꺼리는 팀이 많다
- 비용: Premium request 한도 신경 안 쓰고 무제한으로 쓸 수 있다
- 실험: 다양한 오픈소스 모델을 빠르게 테스트해볼 수 있다

설정하는 법 — 생각보다 간단하다
먼저 Ollama가 로컬에 설치되어 있어야 한다. Mac이면 brew install ollama 한 줄이면 끝.
모델 하나 받아두자. 코딩용이면 Qwen 2.5 Coder나 DeepSeek Coder가 좋다.
ollama pull qwen2.5-coder:7b
ollama serve
VS Code에서 Copilot Chat을 열고 모델 선택 드롭다운을 보면 Ollama 모델이 보인다. 선택하면 바로 로컬 추론으로 전환된다. 별도 설정 파일 수정 같은 거 없다.
해봤는데 7B 모델 기준으로 M 시리즈 맥에서 응답 속도가 꽤 쓸 만하다. 물론 GPT-5나 Claude Opus 급은 아니지만, 간단한 코드 리뷰나 함수 생성 정도는 충분하다.

에이전트 모드에서도 쓸 수 있다는 게 핵심
단순히 Chat에서만 되는 게 아니다. Copilot Agent Mode에서도 로컬 모델을 백엔드로 쓸 수 있다. 에이전트 모드가 뭐냐면, Copilot이 여러 파일을 자동으로 수정하고, 터미널 명령어 실행하고, 에러 나면 스스로 고치는 자율 코딩 기능이다. 3월에 VS Code랑 JetBrains 모두 GA됐다.
로컬 모델로 에이전트 모드를 돌리면 당연히 클라우드 모델보다 결과물 퀄리티는 떨어진다. 근데 간단한 리팩토링이나 테스트 생성 같은 작업은 오히려 네트워크 레이턴시 없이 빠르게 처리되는 장점이 있다.
한계도 분명히 있다
솔직히 말하면, 7B~13B급 로컬 모델로 복잡한 아키텍처 질문을 던지면 답이 좀 아쉽다. 컨텍스트 윈도우도 클라우드 모델 대비 작고. 맥 16GB RAM이면 7B가 현실적 한계다. 32GB 이상이어야 13B를 돌릴 만하다.
그리고 코드 자동완성(inline completion)은 아직 Copilot 자체 경량 모델만 지원한다. Ollama 연동은 Chat과 Agent Mode에 한정된다는 점은 알아둬야 한다.
어떤 조합이 좋을까
내가 써보고 나서 정리한 조합은 이렇다.
- 일반 코딩: Copilot 기본 자동완성 (가장 빠르니까)
- 복잡한 설계 질문: Claude Opus나 GPT-5 (Premium request 사용)
- 간단한 리팩토링/테스트: Ollama 로컬 모델 (빠르고 무료)
- 보안 민감 코드: 로컬 모델 필수
클라우드와 로컬을 상황에 따라 왔다갔다 할 수 있게 된 게 핵심이다. 전에는 둘 중 하나를 골라야 했는데, 이제 같은 인터페이스에서 스위칭이 된다. 이건 확실히 편하다.
📎 참고 자료
'github' 카테고리의 다른 글
| GitHub Copilot Cloud Agent, 이제 PR 없이도 코드 작업이 된다 (0) | 2026.04.03 |
|---|---|
| GitHub Models, 토큰 하나로 GPT-4o·Llama·Mistral 다 쓸 수 있다 (0) | 2026.04.02 |
| GitHub Spark, 자연어로 앱 만들기가 진짜 가능한가 (0) | 2026.03.31 |
| GitHub Actions에 드디어 타임존 설정이 생겼다 (0) | 2026.03.31 |
| TypeScript가 GitHub 1위 언어가 됐다, 근데 더 큰 변화가 따로 있다 (0) | 2026.03.30 |