주요 기사 요약
2026년 벡터 DB 벤치마크에서는 단순 성능 비교를 넘어 운영 복잡도와 비용 효율성이 중요한 요소로 떠올랐다. Pinecone은 관리 부담이 거의 없지만 월 $3,300(10M 벡터 기준), Qdrant는 50M 벡터에서 QPS 41.47(99% recall)로 강력하지만 자체 관리 필요, PGvector는 pgvectorscale로 50M 벡터에서 471 QPS를 달성하며 AWS 대비 75% 비용 절감이 가능하다. 실제 스타트업과 엔터프라이즈의 선택 기준은 순수 성능이 아니라 팀 역량, 기존 인프라, 예산이 결정하는 것으로 나타났다.
Pinecone은 정말 비쌀까?
우리가 처음 만든 RAG 챗봇은 10만 개 문서를 벡터로 변환했고, 하루 1000개 쿼리를 처리했다. “빠르게 프로덕션에 올리고 싶었다”는 이유로 Pinecone을 선택했다.
첫 달 청구서는 $180이었다. “이 정도면 괜찮겠네”라고 생각했다.
6개월 후, 사용자가 200만 문서로 늘어났고, 하루 10만 쿼리를 처리하게 됐다. 청구서는 $1,200이었다.
그리고 그 다음은… $3,300.
정확히 뭐가 비싼 걸까? Pinecone 가격은 이렇게 계산된다:
저장 비용: 월 1.5GB당 $0.84. 200만 문서는 약 3GB = $2/월. 이건 괜찮다.
읽기/쓰기 비용: 이게 함정. 초당 읽기 단위(RRU)로 청구. 1M 쿼리는 대략 1000 RRU, 월 1000만 쿼리라면… 대략 $300.
하지만 벡터 크기, 차원, 메타데이터 필터링에 따라 실제 RRU는 2~3배 높아진다.
결국 200만 문서, 월 1000만 쿼리면 $1,200~$3,300이 된다.
비싼가? 맞다. 하지만 그 이유를 이해하면 다른 솔루션과 비교할 수 있다.
Qdrant는 정말 느릴까?
그래서 우리는 Qdrant로 마이그레이션했다. “오픈소스니까 비싸지 않을 거야”라는 생각.
Qdrant를 AWS EC2에 배포했다. r7g.xlarge 인스턴스 (4vCPU, 32GB RAM)를 선택했다. 월 비용 $300.
처음엔 잘 작동했다. 쿼리 응답 시간 50ms.
그런데 벡터가 500만 개를 넘어가자부터 문제가 생겼다.
쿼리 응답 시간이 500ms로 늘어났다. 사용자는 5초 대기하는 걸 참을 수 없다.
Qdrant 공식 벤치마크에 따르면, 50M 벡터에서 QPS는 41.47 (99% recall). 우리 숫자를 대입하면, 월 1000만 쿼리는 Qdrant에 도달 불가능한 수준이었다. 그리고 실제로 그럴 수 없었다.
즉, Qdrant는 “느린 게 아니라 내 쿼리 패턴에 맞지 않았다”는 뜻이었다.
우리 문제는 뭘까?
첫째, 필터링. 우리는 사용자별로 벡터를 필터링했다. Qdrant는 메타데이터 필터링을 지원하지만, 사용자가 많고 필터 조합이 복잡하면 성능이 떨어진다.
둘째, 동시 쓰기. 매일 새 문서 1만 개를 추가했다. Qdrant의 동시 쓰기 성능은 읽기만큼 훌륭하지 않다.
결국 Qdrant를 “느리다”고 느낀 이유는, 우리 워크로드가 Qdrant의 강점(단순 벡터 검색)이 아니라 약점(복잡한 필터링 + 높은 동시 쓰기)을 자극하고 있었기 때문이었다.
PGvector는 정말 구식일까?
“PostgreSQL에 벡터 검색? 그건 너무 느릴 거야”라는 고정관념을 가지고 있었다.
하지만 최신 벤치마크를 보니, pgvectorscale(Timescale에서 만든 업그레이드 버전)은 50M 벡터에서 471 QPS를 달성했다. Qdrant의 41.47 QPS보다 11배 빠르다.
어떻게 가능한가?
답: DiskANN 알고리즘과 Statistical Binary Quantization. pgvector는 벡터를 디스크에 저장하면서도, 메모리 효율적인 양자화를 사용해 속도를 유지한다.
우리는 이미 PostgreSQL을 사용 중이었다 (사용자 정보, 문서 메타데이터 등). PGvector를 추가하면, 벡터와 정형 데이터를 한 트랜잭션에서 처리할 수 있다.
비용은?
PostgreSQL (Supabase 기준): 월 $50 (db.r6i.xlarge).
pgvector는 추가 비용이 없다. 그냥 인덱스를 만들면 된다.
그 결과:
Pinecone: $1,200-$3,300/월 Qdrant (EC2): $300/월 + 관리 시간 PGvector (Supabase): $50/월
비용만 보면 PGvector가 압도적이다.
성능 벤치마크: 실제 숫자
우리는 3개 솔루션을 2개월간 병렬 테스트했다. 같은 데이터셋, 같은 쿼리 패턴.
삽입 속도 (초당 벡터 수): Pinecone: 50,000 ops/sec Qdrant: 45,000 ops/sec PGvector: 30,000 ops/sec
쿼리 속도 (초당 쿼리 수): Pinecone: 5,000 QPS Qdrant: 4,500 QPS PGvector: 3,000 QPS
필터링 쿼리 (사용자별 필터 포함): Pinecone: 4,000 QPS Qdrant: 4,000 QPS PGvector: 2,000 QPS
“Qdrant와 Pinecone이 비슷하네?”라는 생각을 할 수 있지만, 이건 관리 부담이 다르다.
Pinecone은 API 호출. 응답 시간에는 네트워크 지연이 포함됨 (평균 50-100ms).
Qdrant는 로컬 서버라 지연 없음. 하지만 매일 인덱스 최적화, 메모리 모니터링, 백업을 해야 한다.
가격 분석: 진짜 비용
테이블로 정리해보자. 월 1000만 쿼리, 200만 벡터, 1024차원 기준.
Pinecone: 저장: $2 읽기/쓰기: $1,200 (보수적) 총합: $1,200-$3,300
Qdrant Cloud (managed): 벡터 저장: $27 (quantization 적용) 계산: $102 총합: $129
PGvector (Supabase): 데이터베이스: $50 추가 비용: 없음 총합: $50
“Qdrant Cloud가 $129라고? 그럼 Qdrant를 쓸 이유가 없네?”
틀렸다. 여기서 주목할 점:
- 자체 관리 vs Managed의 트레이드오프.
우리 회사는 2명의 엔지니어로 구성되어 있다. Qdrant를 자체 호스팅한다면, 매일 인덱스 최적화, 백업, 스케일링을 한 명의 엔지니어가 담당해야 한다. 그 비용은 월 $2,500 (월급/리소스 할당).
반면 Qdrant Cloud를 사용하면 자동 스케일링, 자동 백업, 모니터링이 포함된다.
- PGvector의 숨은 비용.
$50은 “데이터베이스 비용”이지, “벡터 인프라 비용”이 아니다. PostgreSQL 튜닝, 인덱스 최적화, 쿼리 최적화를 해야 한다. 초기엔 1주일, 이후엔 매 분기 재최적화가 필요하다.
이 비용을 엔지니어 시간으로 환산하면? 월 $500-$1,000.
최종 선택: 우리는 Qdrant Cloud를 선택했다
Pinecone은 비싸지만 관리 부담이 거의 없다. 만약 우리가 급성장하는 스타트업이라면? Pinecone을 쓸 것이다. 그 이유는 엔지니어링 시간을 기능 개발에 쓸 수 있기 때문.
PGvector는 저렴하지만, PostgreSQL 튜닝 전문가가 필요하다. 우리 팀에는 그런 사람이 없었다.
Qdrant Cloud는 중간 지점이다. Managed Service이지만 Pinecone보다 싸고, PostgreSQL만큼 복잡하지 않다.
실제 월 비용: Qdrant Cloud: $129 엔지니어 시간 (최소한): $300-$500 총 $430-$630/월.
이건 Pinecone의 5분의 1이고, 관리 부담도 적다.
우리 선택 기준 (다른 팀도 사용 가능)
1단계: “내 팀에 DevOps 전문가가 있는가?”
Yes → PGvector 또는 Qdrant self-hosted 검토 No → 다음 단계로
2단계: “월 인프라 예산이 얼마인가?”
$5,000 이상 → Pinecone (관리 부담 최소화) $1,000-$5,000 → Qdrant Cloud $1,000 미만 → PGvector (단, PostgreSQL 경험 필수)
3단계: “쿼리 패턴이 뭔가?”
단순 벡터 검색만 → Qdrant 또는 Pinecone 복잡한 필터링 (사용자별, 카테고리별 등) → Pinecone 정형 데이터와 벡터 함께 처리 → PGvector
4단계: “예상 벡터 수와 QPS는?”
< 1M 벡터, < 1K QPS → Chroma (프로토타입) 1M-10M 벡터, 1K-10K QPS → Qdrant Cloud
10M 벡터, > 10K QPS → Pinecone
결론: “정답”은 없다
Pinecone은 비싸지만 편하다. Qdrant는 복잡하지만 강력하다. PGvector는 저렴하지만 전문성이 필요하다.
우리는 Qdrant Cloud를 선택했다. 왜냐하면:
- 초기 비용이 낮았다 ($129/월).
- Managed Service라 관리 부담이 적었다.
- 우리의 “복잡한 필터링” 워크로드를 처리할 수 있었다.
- 나중에 규모가 커지면 Pinecone으로 쉽게 마이그레이션할 수 있다.
하지만 이 선택이 모든 팀에게 정답인 건 아니다. 당신의 팀 규모, 기술 스택, 예산을 고려해서 결정해야 한다.