로컬 AI를 직접 운영하면서 알게 된 것들, 클라우드 없이 현실적으로 시작하는 법

로컬AI운영

회사에서 ChatGPT 쓰다가 한 번쯤 이런 생각 해본 적 없는가. “이 데이터, 외부 서버로 나가도 괜찮은 건가?” 실제로 2023년 삼성전자 반도체 부문에서 챗GPT에 소스코드를 입력한 사건 이후, 국내 대기업 상당수가 외부 AI 서비스 이용을 제한하기 시작했다. 그리고 2026년 지금, 상황은 더 심각해졌다. AI 기본법 시행을 앞두고 데이터 거버넌스에 대한 압박이 커지면서, 기업이든 개인 개발자든 “내 … Read more

LLaMA 4와 LM Studio 0.4 정리: MoE 전환과 로컬 AI 환경의 변화

LLaMA4 & LM STUDIO 0.4

작년까지만 해도 LLaMA 3 시리즈에 LM Studio 0.3을 조합해서 로컬 AI를 돌리는 게 최선이었다. 그런데 2025년 4월 메타가 LLaMA 4를 공개하고, LM Studio도 0.4 메이저 업데이트를 거치면서 상황이 완전히 달라졌다. 솔직히 말하면, LLaMA 4 Scout을 처음 H100 한 장에 올렸을 때의 충격이 아직도 생생하다. 이전 세대와는 차원이 다른 멀티모달 성능에 1000만 토큰 컨텍스트 윈도우라니. 그리고 … Read more

Azure AI 아키텍처 설계할 때 처음부터 알았으면 좋았을 것들

Azure AI 아키텍처 설계

Azure AI 시스템을 처음 설계하려고 Portal 앞에 앉았을 때 솔직히 말하면 나도 처음엔 Azure Portal 앞에서 멍하니 앉아 있었다. 수백 개 서비스가 화면 가득 펼쳐져 있는데, 뭘 먼저 눌러야 할지 도통 감이 안 잡혔다. 주변에서는 AI Foundry가 어쩌고, Managed Identity가 저쩌고 하는데, 나는 OpenAI API Key 하나 .env 파일에 넣고 직접 호출하면 되지 왜 이렇게 … Read more

Azure 기반 엔터프라이즈 AI 아키텍처 – 설계와 운영 실전 로드맵

Azure_AI_아키텍처설계_운영

솔직히 고백하자면, 나도 처음에는 Azure에서 AI 시스템을 설계한다고 했을 때 막막했다. Portal에 로그인하면 수백 개의 서비스가 펼쳐지고, 어디서부터 손대야 할지 감이 안 왔다. OpenAI API를 직접 호출하면 되는 걸 왜 굳이 Azure를 끼고 복잡하게 만들어야 하지? 그때는 진심으로 그렇게 생각했다. 그런데 실제로 기업 환경에서 AI 서비스를 운영하면서 생각이 완전히 바뀌었다. API Key 하나 유출되면 수천만 … Read more

오픈클로설치 윈도우 WSL2 및 텔레그램 연동하는 방법

오픈클로_윈도우WSL2설치_텔레그램연동

솔직히 말하면, 나도 처음에는 오픈클로가 뭔지 정확히 몰랐다. 트위터에서 “AI가 내 대신 이메일 정리하고, 일정 잡고, 코드까지 돌린다”는 글을 봤을 때 반신반의했다. 그런데 실제로 깔아보니까 진짜였다. 텔레그램으로 “내일 오전 10시 미팅 잡아줘”라고 보내면 캘린더에 알아서 등록되고, “어제 온 메일 중에 급한 거 정리해줘”라고 하면 요약본이 날아온다. 이건 챗봇이 아니라 진짜 비서다. 그런데 문제가 하나 있다. … Read more