Temperature 0과 1의 차이, 고객 서비스는 0.3, 창작은 0.9가 맞다

Temperature_0과1

주요 기사 요약 2026년 최신 논문에서는 다양한 모델 크기(1B부터 80B)에서 온도값 0.1부터 1.9까지의 영향을 체계적으로 분석했다. 특히 질문 답변, 감정 분석, 수학 문제 해결, 창의적 글쓰기, 지시 준수, 번역 등 6개 능력에서 온도에 따른 성능 차이를 확인했다. 연구 결과, 온도 2.0 이상은 일관성 없고 정보 가치가 낮은 텍스트를 생성하는 것으로 나타났다. 특히 주목할 점은 “온도는 … Read more

클라이언트에게 “해킹됐어요!” 신고를 받기 전에 알아야 할 OWASP Top 10

OWASP

주요 기사 요약 OWASP는 2021년에 발표한 웹 애플리케이션 보안 위협 Top 10을 통해 접근 제어 파괴, 암호화 실패, 인젝션 공격, 부적절한 설계, 보안 설정 오류 등 가장 위험한 10가지 취약점을 정의했다. 2025년에는 AI 에이전트 및 API 기반 시스템의 증가로 인해 새로운 위협들이 부상하고 있으며, 특히 소프트웨어 공급망 공격이 급증하고 있다. 가트너는 2025년까지 전 세계 조직의 … Read more

LLM은 왜 프롬프트 인젝션에 취약할까? 악의적 사용자를 어떻게 막을까?

프롬프트_인젝션

주요 기사 요약 2026년 OWASP는 LLM 애플리케이션의 최우선 보안 위협 1순위로 ‘프롬프트 인젝션’을 꼽았다. 실제로 Microsoft 365 Copilot의 EchoLeak(CVE-2025-32711)이 제로 클릭 프롬프트 인젝션 취약점으로 공개되었고, CurXecute 공격은 소프트웨어 개발 환경에서 원격 코드 실행을 가능하게 했다. Bing Chat은 사이트에 숨겨진 지시문으로 인해 민감한 시스템 정보를 노출했으며, AI 보안 도구를 겨냥한 Skynet 악성코드는 악성 파일을 안전한 것으로 … Read more

Few-shot 프롬프트 예시 5개 추가하면 진짜 답변이 달라질까, 우리 서비스로 검증해봤다

few_shot_learning

주요 기사 요약 2026년 초거대 언어모델 분야에서 주목받는 기술은 Few-shot Learning이다. IBM과 Google이 발표한 최신 보고서에 따르면, 제한된 예시만으로도 모델의 성능을 극적으로 향상시킬 수 있다는 것이 증명되었다. 특히 금융 분야에서 GPT-4는 FinQA 데이터셋에서 78% 정확도를 달성했으며, 이는 평균적인 인간의 점수를 능가하는 수준이다. 또한 프롬프트 기반 메타 러닝(Meta-Learning)과 프로토타입 네트워크가 컴퓨터 비전에서 혁신적인 성과를 보이고 있다. … Read more

같은 질문인데 프롬프트만 바꿨는데 정확도가 30% 올라갔다

프롬프트중요성

“이게 진짜 되나? 프롬프트 한 줄만 추가했는데?” 처음 이 현상을 본 건 어떤 개발자의 깃허브 이슈였다. 수학 문제를 푸는 LLM의 정확도가 18%에서 57%로 올라갔다는 내용이었다. 처음엔 믿기지 않았다. 모델을 다시 학습시킨 것도 아니고, 더 큰 모델로 바꾼 것도 아닌데 어떻게 40% 가까이 올라갈 수 있을까. 하지만 더 찾아본 결과 이건 실제로 일어나는 일이었고, 지금 업계에서는 … Read more