L40s에서 최신 vLLM 기반 Gemma·Qwen으로 구축하는 한국어 RAG 모델: 성능과 가성비 모두 잡는 방법

L40S_vLLM_Gemma_Qwen

최근 생성형 AI 분야에서는 단순한 텍스트 생성 모델을 넘어서, 검색 기반 생성(RAG, Retrieval-Augmented Generation) 방식이 뜨거운 관심을 받고 있습니다. 특히 한국어와 같이 다국어 지원이 완벽하지 않은 언어에서는, RAG 구조를 활용해 신뢰도 높은 정보를 생성하는 것이 매우 중요합니다. 이번 포스팅에서는 최신 vLLM 환경에서 Google의 Gemma 및 Alibaba의 Qwen 모델을 활용하여, L40s GPU 환경에서 구동 가능한 가성비 … Read more

AI 도구 호출의 진화, OpenAI Tool Calling부터 LangGraph까지 분석 및 총정리

AI도구호출의진화 tool calling, langgraph

인공지능이 단순한 대화를 넘어 실제 도구를 활용해 복잡한 작업을 수행하는 시대가 열렸습니다. 특히 대형 언어 모델이 외부 API나 함수를 직접 호출할 수 있는 도구 호출 기능은 AI 애플리케이션의 가능성을 무한대로 확장했습니다. 하지만 각 AI 플랫폼마다 서로 다른 방식을 사용하고 있어 개발자들은 혼란을 겪고 있습니다. 오늘은 OpenAI의 Tool Calling 기능부터 LangChain, LangGraph까지 현재 AI 도구 호출 … Read more

Function Calling에서 Tool Calling – LLM의 진화 과정과 LangChain 생태계

function_calling

시작하며 2023년 AI 생태계에서 가장 중요한 변화 중 하나는 바로 Function Calling 기술의 도입이었습니다. 이 기술은 단순히 텍스트만 생성하던 LLM이 외부 도구와 상호작용할 수 있게 만들어주는 혁신적인 기능이었죠. 오늘은 이 기술이 어떻게 발전해왔는지, 그리고 현재 가장 주목받는 LangGraph와 @tool 데코레이터까지의 여정을 자세히 살펴보겠습니다. Function Calling의 탄생과 발전 연대기 2022년: LangChain의 선구적 역할 사실 많은 사람들이 … Read more

LangGraph 서브그래프와 에이전트 아키텍처, 복잡한 AI 시스템을 단순하게 만드는 방법

랭그래프_에이전트_아키텍처 AI 시스템

AI 에이전트를 개발하다 보면 단순한 질문-답변을 넘어 더 복잡한 작업을 처리해야 하는 상황에 부딪힙니다. 여러 단계를 거쳐야 하거나, 다양한 도구를 사용해야 하거나, 심지어 여러 에이전트가 협력해야 하는 경우도 있죠. 이런 복잡한 요구사항을 어떻게 체계적으로 관리할 수 있을까요? 오늘은 LangGraph의 서브그래프와 다양한 에이전트 아키텍처를 통해 이 문제를 해결하는 방법을 알아보겠습니다. 에이전트 아키텍처의 기본 개념 이해하기 먼저 … Read more

LangGraph 워크플로우와 에이전트 완벽 이해 가이드 – 초보자를 위한 실무 중심 설명

LangGraph_에이전트

AI 개발에서 워크플로와 에이전트라는 용어를 자주 들어보셨을 겁니다. 하지만 정확히 무엇이고 어떻게 다른지, 그리고 언제 어떤 것을 사용해야 하는지 헷갈리시는 분들이 많습니다. 오늘은 LangGraph를 통해 이 개념들을 쉽고 명확하게 설명드리겠습니다. 워크플로와 에이전트, 무엇이 다른가요? 먼저 핵심 차이점부터 이해해봅시다. **워크플로(Workflow)**는 미리 정해진 순서대로 일하는 직원과 같습니다. 매뉴얼이 있고, 단계별로 정확히 따라하죠. 반면 **에이전트(Agent)**는 상황을 보고 스스로 … Read more

Langchain 기초 – ChatOpenAI, LLMChain, PromptTemplate 마스터 첫걸음(LLM)

langchain

Langchain 기초, 그리고 생성형 AI 활용의 패러다임 Langchain은 OpenAI의 ChatGPT를 비롯해 여러 대형 언어모델(LLM, Large Language Model)을 파이썬 환경에서 쉽고 강력하게 활용할 수 있게 해주는 프레임워크다. 단순히 텍스트 입력과 출력에 그치지 않고, 여러 단계의 프롬프트(지시문), 사용자 입력, 외부 도구와의 연동, 다중 모델 체이닝까지 구현할 수 있다. 실제 프로덕트에서 “챗봇처럼 자연어 대화형 인터페이스를 만들고 싶다”, “문서 … Read more