LLM이 없는 정보를 만들어내는데, 할루시네이션? RAG 잘못 이해했나?

RAG_할루시네이션

주요 기사 요약 ICLR 2025에 발표된 최신 연구에 따르면, RAG를 도입한 시스템도 여전히 35-62%의 확률로 틀린 답변을 제공하고 있다. 더 충격적인 것은 RAG를 적용하면 오히려 LLM의 “모르겠습니다”라는 기권율이 감소한다는 사실이다. Claude 3.5 Sonnet은 RAG 없이 84.1%를 기권했지만, RAG 적용 후 52%로 떨어졌다. 구글 연구팀은 이 문제를 “충분한 맥락(Sufficient Context)”과 “선택적 생성(Selective Generation)” 개념으로 해결하려 하고 … Read more

같은 질문인데 프롬프트만 바꿨는데 정확도가 30% 올라갔다

프롬프트중요성

“이게 진짜 되나? 프롬프트 한 줄만 추가했는데?” 처음 이 현상을 본 건 어떤 개발자의 깃허브 이슈였다. 수학 문제를 푸는 LLM의 정확도가 18%에서 57%로 올라갔다는 내용이었다. 처음엔 믿기지 않았다. 모델을 다시 학습시킨 것도 아니고, 더 큰 모델로 바꾼 것도 아닌데 어떻게 40% 가까이 올라갈 수 있을까. 하지만 더 찾아본 결과 이건 실제로 일어나는 일이었고, 지금 업계에서는 … Read more

LangGraph Agent는 정말 JSON으로 응답하고 프롬프트와 연동될까?

langgraph_agent_json_prompt

안녕하세요! LLM 개발을 시작하신 초보 개발자 여러분을 위해 LangGraph의 핵심 개념을 쉽게 설명해드리겠습니다. 특히 Agent가 JSON으로 응답하는 방식과 프롬프트와의 연동 과정을 자세히 알아보겠습니다. LangGraph가 뭔가요? LangGraph는 LangChain에서 만든 AI Agent 프레임워크입니다. 복잡한 작업을 여러 단계로 나누어 처리할 수 있게 해주는 도구라고 생각하시면 됩니다. 간단히 말해서: Graph(그래프): 작업 흐름을 노드(Node)와 엣지(Edge)로 연결한 구조 Node(노드): 실제 작업을 … Read more