Azure AI Foundry 입문 가이드, GPT-5 모델 배포부터 API 호출까지 한번에 따라하기

Azure AI Foundry

작년까지만 해도 Azure에서 OpenAI 모델을 쓰려면 Azure OpenAI Service를 직접 다뤄야 했다. 약간 복잡했다. 여러 서비스를 오가야 했고, 모니터링도 헷갈렸고, 모델 배포도 손이 많이 갔다. 그런데 올해 1월 기준으로 Azure AI Foundry가 본격적으로 작동하면서 판이 바뀌었다. 이건 단순한 UI 개선이 아니라, 전체 개발 경험을 다시 생각한 플랫폼이다. 내가 처음 Azure AI Foundry를 켰을 때 느낀 … Read more

LLM이 제멋대로 답변하는데, JSON으로만 뱉게 하는 방법

LLM답변_JSON

주요 기사 요약 2026년 LLM 통합 개발자들은 Output 포맷 강제의 문제를 지속적으로 마주친다. OpenAI의 최신 연구에서는 LLM이 JSON 형식으로 코드를 반환할 때 Markdown으로 반환하는 것보다 성능이 떨어진다는 것을 발견했다. Google의 Gemini는 response_mime_type 파라미터로 JSON 출력을 강제할 수 있으며, lm-format-enforcer와 outline 같은 오픈소스 도구들은 Grammar 기반 제약을 통해 정확한 형식 준수를 보장한다. 특히 금융, 의료, 데이터 … Read more

Temperature 0과 1의 차이, 고객 서비스는 0.3, 창작은 0.9가 맞다

Temperature_0과1

주요 기사 요약 2026년 최신 논문에서는 다양한 모델 크기(1B부터 80B)에서 온도값 0.1부터 1.9까지의 영향을 체계적으로 분석했다. 특히 질문 답변, 감정 분석, 수학 문제 해결, 창의적 글쓰기, 지시 준수, 번역 등 6개 능력에서 온도에 따른 성능 차이를 확인했다. 연구 결과, 온도 2.0 이상은 일관성 없고 정보 가치가 낮은 텍스트를 생성하는 것으로 나타났다. 특히 주목할 점은 “온도는 … Read more

Few-shot 프롬프트 예시 5개 추가하면 진짜 답변이 달라질까, 우리 서비스로 검증해봤다

few_shot_learning

주요 기사 요약 2026년 초거대 언어모델 분야에서 주목받는 기술은 Few-shot Learning이다. IBM과 Google이 발표한 최신 보고서에 따르면, 제한된 예시만으로도 모델의 성능을 극적으로 향상시킬 수 있다는 것이 증명되었다. 특히 금융 분야에서 GPT-4는 FinQA 데이터셋에서 78% 정확도를 달성했으며, 이는 평균적인 인간의 점수를 능가하는 수준이다. 또한 프롬프트 기반 메타 러닝(Meta-Learning)과 프로토타입 네트워크가 컴퓨터 비전에서 혁신적인 성과를 보이고 있다. … Read more

같은 질문인데 프롬프트만 바꿨는데 정확도가 30% 올라갔다

프롬프트중요성

“이게 진짜 되나? 프롬프트 한 줄만 추가했는데?” 처음 이 현상을 본 건 어떤 개발자의 깃허브 이슈였다. 수학 문제를 푸는 LLM의 정확도가 18%에서 57%로 올라갔다는 내용이었다. 처음엔 믿기지 않았다. 모델을 다시 학습시킨 것도 아니고, 더 큰 모델로 바꾼 것도 아닌데 어떻게 40% 가까이 올라갈 수 있을까. 하지만 더 찾아본 결과 이건 실제로 일어나는 일이었고, 지금 업계에서는 … Read more