LLM에게 도구를 줄 때, 너무 많으면 혼란 – Tool Calling 설계 문제

Tool Calling 설계 문제

이런 경험 있나요? 도구 목록이 30개만 되어도 LLM이 헤맨다 개발자들이 LLM 에이전트를 만들면서 가장 흔하게 겪는 문제가 뭘까요? 바로 Tool Calling입니다. 사용자 요청을 받은 LLM이 필요한 도구를 선택해서 호출하는 것 같은데, 도구 개수가 조금 늘어나면 정확도가 확 떨어집니다. 웹 검색 도구, 데이터베이스 조회 도구, API 호출 도구, 계산기, 캘린더, 이메일 등 실무에서 쓸 만한 도구들을 … Read more

Node.js가 AI 에이전트의 미래다 – Flowise, LangChain, LangGraph의 실제 프로덕션 사례 분석

node.js_AI에이전트

요약: Python은 더 이상 AI의 유일한 선택지가 아니다 2024년까지만 해도 생성형 AI 에이전트와 RAG 시스템을 구축하려면 Python이 필수였습니다. LangChain, LangGraph, AutoGen 등 모든 주요 프레임워크가 Python을 먼저 지원했거든요. 하지만 2025년은 달라졌습니다. Flowise, LangChain.js, LangGraph.js를 중심으로 Node.js 생태계가 빠르게 성숙하고 있고, 실제로 프로덕션 환경에서 성공 사례들이 나타나고 있습니다. 특히 주목할 점은 LangChain.js 코어 패키지가 주당 120만 … Read more

에이전트 AI만 핫해? RPA도 AI와 만나 진화 중 – 오픈소스 RPA의 성공 전략

RPA_오픈소스

2026년 RPA 시장의 핵심 변화: 단순 자동화에서 지능형 자동화로 매번 새로운 에이전트 프레임워크가 나올 때마다 주목하던 개발자라면, 한 가지 놓친 게 있을 겁니다. 바로 RPA 영역에서도 동일한 흐름이 일어나고 있다는 거죠. 초기 RPA는 반복 업무를 규칙 기반으로 자동화하는 수준이었습니다. 거래소 데이터 입력, 엑셀 시트 정리, 이메일 발송 같은 거죠. 하지만 2025년부터는 달라졌습니다. RPA에 LLM이 붙고, … Read more

전체 모델을 학습할 수 없으면 LoRA로 하는데, 정말 효과 있을까?

LoRA

LoRA가 AI 업계의 게임 체인저가 된 이유 지난 몇 년간 AI 개발자들 사이에서 가장 핫한 기술 중 하나가 LoRA(Low-Rank Adaptation)입니다. 2021년 Microsoft 연구팀이 논문으로 발표한 이후, OpenAI, Hugging Face, Meta 등 거의 모든 AI 기업이 LoRA를 적극 채용하고 있는데, 그 이유는 간단합니다. 전체 모델을 학습하지 않으면서도 전체 파인튜닝과 동등하거나 더 나은 성능을 낼 수 있다는 … Read more

Fine-tuning에 필요한 데이터 품질, 파인튜닝에 100개 좋은 데이터 vs 10000개 나쁜 데이터 비교

Fine-tuning

파인튜닝 프로젝트에서 맞닥뜨리는 가장 흔한 실수 데이터 품질 문제로 파인튜닝이 실패하는 경우가 점점 늘어나고 있습니다. 작년만 해도 글로벌 데이터 라벨링 시장이 224억 달러에 달했으며, 2035년까지 834억 달러로 성장할 것으로 예상되는 시점에서 흥미로운 현상입니다. 기업들이 엄청난 규모의 데이터를 수집하고 있지만, 정작 모델 성능 개선으로는 이어지지 않는 경우가 많다는 뜻이거든요. 최근 실무에서 파인튜닝 프로젝트를 진행하면서 깨닫게 된 … Read more

실무 개발자의 Node.js 버전 관리 전략, Node.js 취약점

Nodejs_버전관리

최신 보안 경보: Node.js 취약점 공지 2025년 1월 Node.js에서는 워커 권한 우회 취약점(CVE-2025-23083)을 포함한 4개의 심각한 보안 취약점을 발표했습니다. 영향을 받는 버전은 v18.20.6, v20.18.2, v22.13.1, v23.6.1 이하입니다. 많은 회사들이 여전히 지원 종료된 버전을 사용 중이라는 점이 문제죠. 이것이 단순한 뉴스가 아닌 이유는 명확합니다. 당신의 서버가 해킹될 수도 있다는 뜻이거든요. 그런데도 많은 팀들이 버전 관리를 미루고 … Read more

LLM이 없는 정보를 만들어내는데, 할루시네이션? RAG 잘못 이해했나?

RAG_할루시네이션

주요 기사 요약 ICLR 2025에 발표된 최신 연구에 따르면, RAG를 도입한 시스템도 여전히 35-62%의 확률로 틀린 답변을 제공하고 있다. 더 충격적인 것은 RAG를 적용하면 오히려 LLM의 “모르겠습니다”라는 기권율이 감소한다는 사실이다. Claude 3.5 Sonnet은 RAG 없이 84.1%를 기권했지만, RAG 적용 후 52%로 떨어졌다. 구글 연구팀은 이 문제를 “충분한 맥락(Sufficient Context)”과 “선택적 생성(Selective Generation)” 개념으로 해결하려 하고 … Read more

LG 클로이드는 정말 ‘제로 가사노동’을 가능하게 할까? 기대와 현실 사이

LG클로이드_가사노동

주요 기사 요약 LG전자가 6일(현지시간) CES 2026에서 양팔과 다섯 손가락을 갖춘 홈로봇 ‘LG 클로이드’를 공개했다. 클로이드는 세탁물 정리, 요리, 청소 등 실제 가사 작업을 수행할 수 있으며, AI 기반으로 거주자의 라이프스타일과 일정을 학습해 가전을 제어하는 AI 비서 역할도 한다. LG전자는 이를 통해 ‘제로 레이버 홈'(가사노동 해방) 비전을 구현한다고 발표했다. 글로벌 서비스 로봇 시장이 연평균 20% … Read more

RAG 시스템, 의미 검색만 믿었다가 단어 검색이 필요한 경우를 발견했다

의미검색_단어검색

주요 기사 요약 2025년 기준 기업 검색 시스템 중 70% 이상이 semantic 기술을 통합했으며, 이는 2019년 30% 미만에서 급증한 수치다. 하지만 실무에서는 semantic search가 모든 상황에 적합하지 않다는 것이 드러났다. 기술 문서 검색, SKU 조회, 법률 문서 검색 등 특정 분야에서는 keyword search의 정확도가 semantic search를 능가한다. 전문가들은 “semantic search는 의도를 이해하지만 keyword search는 명확한 … Read more

벡터 DB 6개월 운영 후 내린 결론: Pinecone, Qdrant, PGvector 선택 기준

벡터DB선택기준

주요 기사 요약 2026년 벡터 DB 벤치마크에서는 단순 성능 비교를 넘어 운영 복잡도와 비용 효율성이 중요한 요소로 떠올랐다. Pinecone은 관리 부담이 거의 없지만 월 $3,300(10M 벡터 기준), Qdrant는 50M 벡터에서 QPS 41.47(99% recall)로 강력하지만 자체 관리 필요, PGvector는 pgvectorscale로 50M 벡터에서 471 QPS를 달성하며 AWS 대비 75% 비용 절감이 가능하다. 실제 스타트업과 엔터프라이즈의 선택 기준은 … Read more