sLLM, SLM, LLM, vLLM 모델 종류와 차이점 안내

sllm

배경 – AI 언어 모델의 발전과 분류 필요성 최근 몇 년 사이에 자연어 처리(NLP) 분야는 급격한 변화를 겪었습니다. 특히 대규모 언어 모델(LLM, Large Language Model)의 등장으로, 기계 번역ㆍ문서 요약ㆍ챗봇ㆍ코드 생성 등 다양한 애플리케이션이 발전했지요. 하지만 모델의 크기, 용도, 추론 방식에 따라 적합한 솔루션이 다르고, 이를 구분하기 위한 용어도 여럿 등장했습니다. 전통적 LLM은 수십억~수백억 개 파라미터로 … Read more

LLaMA 설치부터 LM Studio 활용 실전 가이드(2025년)

llama

왜 LLaMA가 주목받는가? Meta(구 페이스북)가 개발한 LLaMA 시리즈는 2023년 첫 출시 이후로 오픈소스 LLM(대규모 언어 모델)의 대표 주자가 되었습니다. LLaMA는 ChatGPT, Claude, Gemini 등 상업용 AI에 비해 개방성과 유연성, 그리고 현실적인 성능 대비 리소스 최적화로 연구자, 개발자, 스타트업은 물론 기업 연구소에서도 널리 사용되고 있습니다. 2024년 말에는 LLaMA 3가 출시되었고, 다양한 파라미터 버전(8B, 70B 등)과 함께 … Read more

Claude MCP와 LangGraph, LangChain, gRPC 서버 연동을 통한 RAG 에이전트 최적화 전략

claude mcp grpc

LLM 에이전트 설계, 어디까지 진화했는가? 최근 Claude 모델에서 소개된 MCP(Memory-Control-Planning) 개념은 LLM을 이용한 고도화된 에이전트 설계의 지평을 넓히고 있습니다. 동시에 LangChain과 LangGraph 같은 프레임워크는 이러한 LLM 능력을 체계적으로 실현할 수 있도록 돕습니다. 이 글에서는 Claude MCP의 개념을 정리하고, 이를 LangChain 및 LangGraph에 통합하는 실질적인 구조를 제안합니다. 특히 MCP 서버를 gRPC 기반으로 외부에서 운용하는 구조를 상정하고, … Read more

Claude MCP를 활용한 RAG 애플리케이션 – LangChain과 LangGraph 통합 전략

claude mcp

  들어가며 최근 Anthropic의 Claude 모델에서 소개된 MCP(Memory, Control, Planning) 기능은 LLM 기반 애플리케이션 설계에 새로운 전환점을 제시하고 있습니다. 특히 RAG(Retrieval-Augmented Generation) 시스템을 구축할 때, 이 기능은 더욱 정교한 문맥 유지, 대화 흐름 제어, 장기적인 목표 기반의 질의 응답에 기여할 수 있습니다. 본 글에서는 Claude의 MCP 개념을 소개하고, 이를 LangChain과 LangGraph 프레임워크에서 어떻게 통합하여 RAG … Read more

구글 Gemma 모델 설치부터 활용까지 (2025년)

gemma

  안녕하세요, 요즘 AI 모델에 대한 관심, 정말 뜨겁죠. ChatGPT는 물론이고 Mistral, Claude, LLaMA 등 다양한 오픈소스 LLM이 쏟아져 나오고 있는데요, 오늘은 이 중에서도 개발자 친화적인 구글의 최신 모델 Gemma에 대해 이야기해보려 합니다. 2024년 말, 그리고 2025년 상반기까지 가장 핫하게 떠오른 이름 중 하나가 바로 Gemma입니다. “Gemma가 뭐길래?” 하고 궁금하셨던 분들을 위해, 이 글에서는 Gemma … Read more

Mistral 모델 완전정복! 설치부터 RAG 활용까지

Mistral

이번 글에서는 요즘 가장 핫한 오픈소스 LLM 중 하나인 Mistral 모델에 대해 깊이 있게 다뤄보겠습니다. 설치부터 활용, 최적화 기법, 한글 튜닝 모델인 KoMistral까지, 실무에 도움이 되는 실질적인 정보 위주로 구성해봤어요. 요즘 오픈소스 LLM계에서 가장 주목받는 모델 중 하나, 바로 Mistral입니다. GPT 대안으로 각광받고 있고, 성능 대비 가볍고, 라이선스도 깔끔한 모델이라 여러 분야에서 빠르게 채택되고 있어요. … Read more

올라마(OLLAMA) 설치 및 사용 가이드 (2025년 최신)

올라마

  AI 언어 모델은 점점 더 작아지고, 가볍고, 빠르게 실행 가능한 형태로 진화하고 있습니다. 대표적인 사례 중 하나가 바로 OLLAMA(올라마)입니다. 최근 Hugging Face, LM Studio 등과 함께 많은 주목을 받고 있는 올라마는 로컬에서 대형 언어 모델(LLM)을 쉽게 실행하고 활용할 수 있는 프레임워크입니다. 본 글에서는 올라마의 설치 방법, 기본 사용법, 최신 버전 비교, 활용 사례, 그리고 … Read more

Microsoft Phi 모델 최신 트렌드 및 설치/사용 가이드

ms phi 1

  Microsoft Phi 모델 최신 트렌드 및 설치/사용 가이드 최신 트렌드 개요 – Phi 모델의 발전 방향 microsoft phi 모델은 마이크로소프트가 공개한 고성능 대규모 언어 모델로, 자연어 이해·생성 분야에서 빠르게 주목받고 있습니다. 최근 AI 연구 커뮤니티에서는 Phi 모델의 효율적인 추론 속도, 메모리 최적화, 그리고 범용적인 응용 가능성에 주목하고 있으며, 자체 연구뿐 아니라 벤치마크 대회에서도 우수한 … Read more