Ollama와 vLLM으로 Gemma 3 27B 실행 완벽 설치 가이드

ollama_vllm_gemma3_27b

Google의 최신 오픈소스 언어 모델인 Gemma 3 27B는 단일 GPU에서 실행할 수 있는 모델 중 최고 성능을 자랑합니다. 이번 포스팅에서는 Ollama를 사용한 간편한 실행 방법과 고성능 추론을 위한 vLLM 설치 및 사용 방법을 자세히 알아보겠습니다. Gemma 3 27B란? Gemma 3 27B는 Google의 Gemini 2.0과 동일한 기술을 기반으로 개발된 270억 개 파라미터를 가진 오픈소스 언어 모델입니다. … Read more

Windows에서 Kubernetes로 Azure AKS에 Nginx + React 배포하기

kubernetes 배포

이번 포스팅은, Windows PC에서 Kubernetes를 활용하여 Nginx와 React 애플리케이션을 Azure AKS(Azure Kubernetes Service)에 배포하는 전체 과정을 단계별로 설명합니다. 1. 개발 환경 구성 1.1 Docker Desktop 설치 및 Kubernetes 활성화 Docker Desktop 설치 Docker Desktop for Windows 다운로드 설치 시 “Use WSL 2 instead of Hyper-V” 옵션 선택 설치 완료 후 재부팅 Kubernetes 활성화 Docker Desktop … Read more

2025년 최고의 벡터 데이터베이스 비교 분석: Pinecone, Qdrant, pgvector 심층 리뷰

벡터 데이터베이스

벡터 데이터베이스의 중요성 현재 AI 기술이 급속도로 발전하면서 비구조화된 데이터를 효율적으로 처리하고 검색할 수 있는 벡터 데이터베이스의 중요성이 크게 부각되고 있습니다. 특히 ChatGPT와 같은 대화형 AI, 추천 시스템, 이미지 검색, 문서 유사도 분석 등 다양한 분야에서 벡터 임베딩을 활용한 검색이 핵심 기술로 자리잡았습니다. 전통적인 키워드 기반 검색과 달리, 벡터 검색은 의미적 유사성을 바탕으로 동작하기 때문에 … Read more

2025년 완벽한 노트북 구매 가이드: AI모델, LLM 시대에 맞는 현명한 선택법

노트북AI

노트북을 사려고 하면 정말 머리가 아프다. 예전에는 CPU만 좋으면 되었는데, 이제는 GPU가 중요하고, AI 시대라고 해서 VRAM까지 신경 써야 한다. 매장에 가면 판매원은 비싼 것만 추천하고, 인터넷을 찾아보면 정보가 너무 많아서 오히려 더 헷갈린다. 나도 최근에 노트북을 바꾸면서 정말 많은 시행착오를 겪었다. 처음에는 단순히 브랜드와 가격만 보고 골랐다가, 나중에 AI 작업을 해보니 GPU가 발목을 잡더라. … Read more

vLLM 기초, 서버 설치부터 세팅, 호출 방식 및 사양, 언어 모델 확인

vllm 설치, 세팅

vLLM이란 무엇이고 왜 각광받는가 vLLM은 최근 AI/LLM 분야에서 급부상하고 있는 초고속 대규모 언어모델 서빙 엔진이다. vLLM의 이름에서 볼 수 있듯이, ‘Virtual’ + ‘LLM(Large Language Model)’을 의미하며, 여러 대형 언어모델을 GPU 환경에서 최대 효율로 빠르게 서비스할 수 있도록 설계되어 있다. 기존 트랜스포머 모델 서빙 엔진들이 가진 비효율성, 예를 들어 토크나이저 처리 병목, 배치 성능 저하, GPU … Read more

sLLM, SLM, LLM, vLLM 모델 종류와 차이점 안내

sllm

배경 – AI 언어 모델의 발전과 분류 필요성 최근 몇 년 사이에 자연어 처리(NLP) 분야는 급격한 변화를 겪었습니다. 특히 대규모 언어 모델(LLM, Large Language Model)의 등장으로, 기계 번역ㆍ문서 요약ㆍ챗봇ㆍ코드 생성 등 다양한 애플리케이션이 발전했지요. 하지만 모델의 크기, 용도, 추론 방식에 따라 적합한 솔루션이 다르고, 이를 구분하기 위한 용어도 여럿 등장했습니다. 전통적 LLM은 수십억~수백억 개 파라미터로 … Read more

LLaMA 설치부터 LM Studio 활용 실전 가이드(2025년)

llama

왜 LLaMA가 주목받는가? Meta(구 페이스북)가 개발한 LLaMA 시리즈는 2023년 첫 출시 이후로 오픈소스 LLM(대규모 언어 모델)의 대표 주자가 되었습니다. LLaMA는 ChatGPT, Claude, Gemini 등 상업용 AI에 비해 개방성과 유연성, 그리고 현실적인 성능 대비 리소스 최적화로 연구자, 개발자, 스타트업은 물론 기업 연구소에서도 널리 사용되고 있습니다. 2024년 말에는 LLaMA 3가 출시되었고, 다양한 파라미터 버전(8B, 70B 등)과 함께 … Read more

구글 Gemma 모델 설치부터 활용까지 (2025년)

gemma

  안녕하세요, 요즘 AI 모델에 대한 관심, 정말 뜨겁죠. ChatGPT는 물론이고 Mistral, Claude, LLaMA 등 다양한 오픈소스 LLM이 쏟아져 나오고 있는데요, 오늘은 이 중에서도 개발자 친화적인 구글의 최신 모델 Gemma에 대해 이야기해보려 합니다. 2024년 말, 그리고 2025년 상반기까지 가장 핫하게 떠오른 이름 중 하나가 바로 Gemma입니다. “Gemma가 뭐길래?” 하고 궁금하셨던 분들을 위해, 이 글에서는 Gemma … Read more

올라마(OLLAMA) 설치 및 사용 가이드 (2025년 최신)

올라마

  AI 언어 모델은 점점 더 작아지고, 가볍고, 빠르게 실행 가능한 형태로 진화하고 있습니다. 대표적인 사례 중 하나가 바로 OLLAMA(올라마)입니다. 최근 Hugging Face, LM Studio 등과 함께 많은 주목을 받고 있는 올라마는 로컬에서 대형 언어 모델(LLM)을 쉽게 실행하고 활용할 수 있는 프레임워크입니다. 본 글에서는 올라마의 설치 방법, 기본 사용법, 최신 버전 비교, 활용 사례, 그리고 … Read more

Microsoft Phi 모델 최신 트렌드 및 설치/사용 가이드

ms phi 1

  Microsoft Phi 모델 최신 트렌드 및 설치/사용 가이드 최신 트렌드 개요 – Phi 모델의 발전 방향 microsoft phi 모델은 마이크로소프트가 공개한 고성능 대규모 언어 모델로, 자연어 이해·생성 분야에서 빠르게 주목받고 있습니다. 최근 AI 연구 커뮤니티에서는 Phi 모델의 효율적인 추론 속도, 메모리 최적화, 그리고 범용적인 응용 가능성에 주목하고 있으며, 자체 연구뿐 아니라 벤치마크 대회에서도 우수한 … Read more