RAG 시스템, 의미 검색만 믿었다가 단어 검색이 필요한 경우를 발견했다

의미검색_단어검색

주요 기사 요약 2025년 기준 기업 검색 시스템 중 70% 이상이 semantic 기술을 통합했으며, 이는 2019년 30% 미만에서 급증한 수치다. 하지만 실무에서는 semantic search가 모든 상황에 적합하지 않다는 것이 드러났다. 기술 문서 검색, SKU 조회, 법률 문서 검색 등 특정 분야에서는 keyword search의 정확도가 semantic search를 능가한다. 전문가들은 “semantic search는 의도를 이해하지만 keyword search는 명확한 … Read more

카페 컵값 따로 계산제, 정부가 놓친 5가지 현실적 문제

카페컵값

주요 기사 요약 정부 기후에너지환경부는 23일 국회에서 2030년까지 폐플라스틱을 30% 감축하기 위한 ‘탈플라스틱 종합대책’을 발표했다. 핵심은 ‘컵 따로 계산제’로, 카페에서 일회용 컵을 쓸 때 영수증에 100~200원의 컵값을 따로 표시하는 제도다. 함께 플라스틱 빨대도 원칙적으로 금지하고, 필요한 경우에만 요청할 때 제공하기로 했다. 하지만 토론회에서 카페 운영자들은 “정책이 현실성 없다”, “이건 개인카페 죽이기 정책”이라며 강한 반발을 했다. … Read more

벡터 DB 6개월 운영 후 내린 결론: Pinecone, Qdrant, PGvector 선택 기준

벡터DB선택기준

주요 기사 요약 2026년 벡터 DB 벤치마크에서는 단순 성능 비교를 넘어 운영 복잡도와 비용 효율성이 중요한 요소로 떠올랐다. Pinecone은 관리 부담이 거의 없지만 월 $3,300(10M 벡터 기준), Qdrant는 50M 벡터에서 QPS 41.47(99% recall)로 강력하지만 자체 관리 필요, PGvector는 pgvectorscale로 50M 벡터에서 471 QPS를 달성하며 AWS 대비 75% 비용 절감이 가능하다. 실제 스타트업과 엔터프라이즈의 선택 기준은 … Read more

청킹전략! 문서를 512토큰씩 자르니까 RAG 정확도가 40% 올라갔다

청킹전략_512토큰

주요 기사 요약 2026년 RAG 최적화 연구에서는 청킹 전략이 검색 정확도에 미치는 영향이 상당함이 확인되었다. 일반적으로 200~500 토큰(약 150~400 단어) 범위를 사용하지만, OpenAI의 text-embedding-ada-002는 256 또는 512 토큰 블록에서 최적 성능을 보인다. TableRAG의 경우 구조화된 데이터 처리로 10~20% 정확도 향상을, 금융 및 재고 관리 시스템은 30% 개선을 보고했다. 특히 청킹 전략을 잘못 선택하면 중요한 개념이 … Read more

LLM이 제멋대로 답변하는데, JSON으로만 뱉게 하는 방법

LLM답변_JSON

주요 기사 요약 2026년 LLM 통합 개발자들은 Output 포맷 강제의 문제를 지속적으로 마주친다. OpenAI의 최신 연구에서는 LLM이 JSON 형식으로 코드를 반환할 때 Markdown으로 반환하는 것보다 성능이 떨어진다는 것을 발견했다. Google의 Gemini는 response_mime_type 파라미터로 JSON 출력을 강제할 수 있으며, lm-format-enforcer와 outline 같은 오픈소스 도구들은 Grammar 기반 제약을 통해 정확한 형식 준수를 보장한다. 특히 금융, 의료, 데이터 … Read more

Temperature 0과 1의 차이, 고객 서비스는 0.3, 창작은 0.9가 맞다

Temperature_0과1

주요 기사 요약 2026년 최신 논문에서는 다양한 모델 크기(1B부터 80B)에서 온도값 0.1부터 1.9까지의 영향을 체계적으로 분석했다. 특히 질문 답변, 감정 분석, 수학 문제 해결, 창의적 글쓰기, 지시 준수, 번역 등 6개 능력에서 온도에 따른 성능 차이를 확인했다. 연구 결과, 온도 2.0 이상은 일관성 없고 정보 가치가 낮은 텍스트를 생성하는 것으로 나타났다. 특히 주목할 점은 “온도는 … Read more

클라이언트에게 “해킹됐어요!” 신고를 받기 전에 알아야 할 OWASP Top 10

OWASP

주요 기사 요약 OWASP는 2021년에 발표한 웹 애플리케이션 보안 위협 Top 10을 통해 접근 제어 파괴, 암호화 실패, 인젝션 공격, 부적절한 설계, 보안 설정 오류 등 가장 위험한 10가지 취약점을 정의했다. 2025년에는 AI 에이전트 및 API 기반 시스템의 증가로 인해 새로운 위협들이 부상하고 있으며, 특히 소프트웨어 공급망 공격이 급증하고 있다. 가트너는 2025년까지 전 세계 조직의 … Read more

LLM은 왜 프롬프트 인젝션에 취약할까? 악의적 사용자를 어떻게 막을까?

프롬프트_인젝션

주요 기사 요약 2026년 OWASP는 LLM 애플리케이션의 최우선 보안 위협 1순위로 ‘프롬프트 인젝션’을 꼽았다. 실제로 Microsoft 365 Copilot의 EchoLeak(CVE-2025-32711)이 제로 클릭 프롬프트 인젝션 취약점으로 공개되었고, CurXecute 공격은 소프트웨어 개발 환경에서 원격 코드 실행을 가능하게 했다. Bing Chat은 사이트에 숨겨진 지시문으로 인해 민감한 시스템 정보를 노출했으며, AI 보안 도구를 겨냥한 Skynet 악성코드는 악성 파일을 안전한 것으로 … Read more

Few-shot 프롬프트 예시 5개 추가하면 진짜 답변이 달라질까, 우리 서비스로 검증해봤다

few_shot_learning

주요 기사 요약 2026년 초거대 언어모델 분야에서 주목받는 기술은 Few-shot Learning이다. IBM과 Google이 발표한 최신 보고서에 따르면, 제한된 예시만으로도 모델의 성능을 극적으로 향상시킬 수 있다는 것이 증명되었다. 특히 금융 분야에서 GPT-4는 FinQA 데이터셋에서 78% 정확도를 달성했으며, 이는 평균적인 인간의 점수를 능가하는 수준이다. 또한 프롬프트 기반 메타 러닝(Meta-Learning)과 프로토타입 네트워크가 컴퓨터 비전에서 혁신적인 성과를 보이고 있다. … Read more

직장인 세무신고 3년차가 본 2026년 근로소득세 개편, 나는 세금을 더 낼까

근로소득세개편

주요 기사 요약 정부가 2026년부터 직장인의 세금과 사회보험료 체계를 개편한다. 가장 큰 변화는 국민연금 보험료율이 9%에서 9.5%로 인상되고, 건강보험료도 0.1%포인트 올라간다는 것이다. 반면 자녀세액공제는 대폭 확대돼 첫째 15만원에서 25만원으로, 둘째 20만원에서 30만원으로, 셋째 30만원에서 40만원으로 인상된다. 보육수당 비과세 한도도 자녀 1인당 월 20만원으로 확대되고, 새로 결혼세액공제 100만원(부부 합계)도 신설된다. 정부는 “저출산 극복과 가정경제 안정을 위한 … Read more