올라마(OLLAMA) 설치 및 사용 가이드 (2025년 최신)

AI 언어 모델은 점점 더 작아지고, 가볍고, 빠르게 실행 가능한 형태로 진화하고 있습니다. 대표적인 사례 중 하나가 바로 OLLAMA(올라마)입니다. 최근 Hugging Face, LM Studio 등과 함께 많은 주목을 받고 있는 올라마는 로컬에서 대형 언어 모델(LLM)을 쉽게 실행하고 활용할 수 있는 프레임워크입니다.

본 글에서는 올라마의 설치 방법, 기본 사용법, 최신 버전 비교, 활용 사례, 그리고 실무에서 어떤 모델을 선택해야 할지에 대해 다루겠습니다.

올라마(OLLAMA)란?

개요

올라마는 2023년 후반기에 등장한 오픈소스 프로젝트로, 로컬 머신에서 LLM(대형 언어 모델)을 실행하기 위한 간단하고 통일된 인터페이스를 제공합니다. 이를 통해 GPT, LLaMA, Mistral, Phi-3, Command R 등 다양한 언어 모델을 프로그래밍 없이 터미널 명령어 하나로 실행할 수 있습니다.

주요 특징

로컬 실행 최적화: GPU 없이 CPU로도 실행 가능
간단한 인터페이스: ollama run model-name 명령만으로 사용 가능
가벼운 설치: 패키지 의존성 최소화
멀티 플랫폼 지원: macOS, Linux, Windows (WSL2)

설치 방법

시스템 요구사항

운영체제: macOS (M1 이상 권장), Linux (Ubuntu 20.04 이상), Windows 11 (WSL2 필수)
메모리: 최소 8GB, 권장 16GB 이상
저장 공간: 모델 다운로드용으로 최소 10GB 이상 여유공간
GPU: 선택 사항. 대부분 CPU만으로도 실행 가능하나, GPU 사용 시 성능 향상

macOS 설치

brew install ollama

설치 후에는 아래 명령으로 서비스 실행:

ollama serve

Linux (Ubuntu 기준)

curl -fsSL https://ollama.com/install.sh | sh

설치가 완료되면 다음 명령으로 서비스 시작:

ollama serve

Windows 설치 (WSL2 필요)

WSL2 설치 및 Ubuntu 환경 구성
위의 Linux 설치 스크립트 사용
Windows Terminal 또는 Ubuntu 환경에서 명령 실행

올라마 사용 방법

모델 실행

ollama run llama3

초기 실행 시, 해당 모델이 자동 다운로드됩니다. 이후엔 로컬에서 바로 사용 가능.

사용 가능한 대표 모델

모델 이름	특징	크기	추천 용도
`llama3`	Meta의 최신 언어 모델, 고성능	8B	범용 대화형 모델
`mistral`	빠르고 가벼운 모델	7B	모바일, IoT 테스트용
`phi3`	Microsoft 소형 모델	3.8B	개인 비서, 스크립팅
`command-r`	RAG 최적화 모델	7B	문서 질의응답 시스템
`codellama`	코드 생성에 특화	7B	프로그래밍 보조

고급 활용법

자체 프롬프트 파일 작성

.ollama 폴더 또는 YAML 파일에 프롬프트 구조 정의 가능:

FROM llama3
PARAMETER temperature=0.8
SYSTEM "너는 전문적인 IT 컨설턴트야."

API 서버 실행

RESTful API 호출을 위한 서버 실행:

ollama serve

엔드포인트:

POST http://localhost:11434/api/generate

요청 예시:

{
  "model": "llama3",
  "prompt": "오늘의 날씨는?"
}

용도	추천 모델	이유
AI 챗봇	LLaMA3	자연어 처리 우수
문서 요약	Mistral	처리 속도 우수
코딩 보조	CodeLLaMA	코드 생성 능력 탁월
질의응답	Command-R	Retrieval 기반 강화
모바일/IoT	Phi-3	경량 모델 최적화

현업에서의 활용 사례

내부 지식베이스 챗봇

RAG(Retrieval Augmented Generation) 기반 챗봇 구축
command-r 모델과 벡터 DB 연동
FAQ 자동화 및 CS 지원

코드 리뷰 및 생성 자동화

GitHub Copilot 대체용
VS Code 연동하여 codellama 사용

로컬 개인 비서

음성 입력 → 텍스트 변환 → phi3 모델 응답
완전 오프라인 개인화 비서 시스템 구축

마무리 및 추천

올라마는 대형 언어 모델을 로컬에서 쉽게 실행할 수 있게 해주는 가장 직관적인 도구입니다. 특히 실무에서 보안상 외부 API를 쓸 수 없는 환경에서는 매우 강력한 솔루션입니다.

부록: 주요 명령어 정리

명령어	설명
`ollama run model-name`	모델 실행
`ollama list`	설치된 모델 목록
`ollama pull model-name`	모델 다운로드
`ollama serve`	API 서버 실행
`ollama create model-name -f Modelfile`	커스텀 모델 생성

이상으로 OLLAMA의 설치부터 실무 활용까지의 전체적인 흐름을 정리해 보았습니다. 향후 모델 성능이 점점 개선되고, 다양한 최적화 기법이 등장할 것으로 보이니 꾸준한 버전 업데이트 확인과 테스트가 중요합니다.

Microsoft Phi 모델 최신 트렌드 및 설치/사용 가이드