비정형 데이터가 돈이 되는 순간 – VLM·RAG·sLLM이 기업 AX를 현실로 만드는 방식

비정형데이_vlm_rag_sllm

AI 전환이라는 말이 워낙 많이 쓰이다 보니 실제로 어디서 돈이 나는지 흐릿해진 감이 있다. 컨퍼런스에서 “우리도 AI 도입했다”는 발표는 넘쳐나는데, 재무제표에 숫자가 찍히는 경우는 생각보다 적다. 그래서 최근 두 가지 사례가 눈에 들어왔다. 플래티어는 2025년 매출을 전년 대비 30% 늘렸다. 적자 폭도 37% 가까이 줄었다. 3년 가까이 이어지던 실적 하락을 뒤집은 핵심 동력이 AX 부문이었다. … Read more

LangGraph AI 에이전트 시스템 설계와 실전 – 개발자 필수 아이템

langgraph AI 에이전트 개발자 필수

솔직히 말하면, 처음 LangGraph를 접했을 때 “이게 왜 필요하지?”라는 생각이 먼저 들었다. LangChain만으로도 충분하지 않나. 프롬프트 엔지니어링 잘하면 그만 아닌가. 그런데 실제로 멀티에이전트 시스템을 프로덕션에 올려본 사람이라면 알 것이다. 에이전트가 두 개만 넘어가도 상태 관리가 지옥이 된다는 걸. 2024년부터 2025년에 걸쳐 AI 개발 생태계에서 가장 뜨거운 키워드 중 하나가 바로 LangGraph였다. GPT-5 시대를 앞두고 단순한 … Read more

Azure AI Search와 Blob Storage 연동하기, RAG 시스템 구축을 위한 실전 아키텍처

Azure AI Search_Blob Storage 연동

Azure AI Search와 Blob Storage 연동하기, RAG 시스템 구축을 위한 실전 아키텍처 지난 3개월간 RAG(Retrieval-Augmented Generation) 시스템을 구축하면서 깨닫게 된 게 있다. LLM의 가장 큰 문제는 “모르는 것도 마치 아는 것처럼 답변한다”는 거다. 이를 hallucination이라고 부르는데, 정말 위험하다. 금융 상담을 한다고 했는데 완전히 잘못된 정보를 제시하면? 의료 조언을 한다고 했는데 엉뚱한 약을 추천하면? 재앙이다. 하지만 … Read more

LLM이 없는 정보를 만들어내는데, 할루시네이션? RAG 잘못 이해했나?

RAG_할루시네이션

주요 기사 요약 ICLR 2025에 발표된 최신 연구에 따르면, RAG를 도입한 시스템도 여전히 35-62%의 확률로 틀린 답변을 제공하고 있다. 더 충격적인 것은 RAG를 적용하면 오히려 LLM의 “모르겠습니다”라는 기권율이 감소한다는 사실이다. Claude 3.5 Sonnet은 RAG 없이 84.1%를 기권했지만, RAG 적용 후 52%로 떨어졌다. 구글 연구팀은 이 문제를 “충분한 맥락(Sufficient Context)”과 “선택적 생성(Selective Generation)” 개념으로 해결하려 하고 … Read more

청킹전략! 문서를 512토큰씩 자르니까 RAG 정확도가 40% 올라갔다

청킹전략_512토큰

주요 기사 요약 2026년 RAG 최적화 연구에서는 청킹 전략이 검색 정확도에 미치는 영향이 상당함이 확인되었다. 일반적으로 200~500 토큰(약 150~400 단어) 범위를 사용하지만, OpenAI의 text-embedding-ada-002는 256 또는 512 토큰 블록에서 최적 성능을 보인다. TableRAG의 경우 구조화된 데이터 처리로 10~20% 정확도 향상을, 금융 및 재고 관리 시스템은 30% 개선을 보고했다. 특히 청킹 전략을 잘못 선택하면 중요한 개념이 … Read more