Qdrant vs PostgreSQL, RAG 검색 인프라 두 가지 다 운영해본 결론

Qdrant vs PostgreSQL

얼마 전에 새 RAG 파이프라인을 설계할 일이 있었다. 기존에 운영하던 시스템은 PostgreSQL에 pgvector를 얹어서 벡터 검색까지 한 곳에서 처리하는 구조였다. 그런데 이번에는 검색 정확도 요구사항이 더 높았고, 팀 내부에서 “Qdrant로 가야 하지 않냐”는 의견이 나왔다. 그래서 결국 둘 다 직접 붙여보고 비교하게 됐다. 이 글은 그 과정에서 겪은 걸 정리한 글이다. 어느 쪽이 “더 좋다”는 … Read more

RAG의 진짜 병목은 LLM이 아니라 데이터 파이프라인 – Apache NiFi로 전처리 자동화

apache_nifi_전처리자동화

RAG 시스템을 처음 만들 때 나는 LLM 선택과 프롬프트 튜닝에 거의 모든 시간을 쏟았다. 어떤 임베딩 모델이 좋은지, 청크 크기를 얼마로 할지, 리랭커를 붙일지 말지. 그런데 막상 프로덕션에 올리고 나니 진짜 골치 아픈 건 전혀 다른 데 있었다. “어제 인사팀이 게시판에 올린 새 규정, 챗봇이 왜 모르지?” 이 한마디가 모든 걸 말해준다. RAG의 답변 품질은 … Read more

판별 AI, 생성 AI, 판단 AI의 결정적 차이와 GraphRAG가 떠오르는 진짜 이유

판별AI_생성AI_판단AI_GraphRAG

며칠 전 한 컨퍼런스 자료를 정리하다가 한 장의 슬라이드 앞에서 한참을 멈췄다. 판별 AI(Discriminative AI), 생성 AI(Generative AI), 판단 AI(Decisive AI)를 한 표에서 직접 비교한 슬라이드였다. 주요 역할, 기술적 특징, 데이터 의존성, 협업 방식, 한계까지 모두 나란히 놓고 보여주는데, 이 표가 흥미로웠던 이유는 그동안 머릿속에서 흩어져 있던 개념들이 한 그림으로 정렬됐기 때문이다. 한 줄로 표현하면 … Read more