요즘 국내 자동화 시장에서 ‘RPA가 끝났다’는 말과 ‘에이전틱 AI로 넘어간다’는 말이 동시에 떠다닌다.
서울 서초구 엘타워에서 4월 17일 열린 ‘AX & 하이퍼오토메이션 코리아 2026-Spring’ 발표 자료를 살펴보다가 이 두 흐름을 정면으로 다루는 한 장면이 눈에 들어왔다. 그리드원 김계관 대표가 ‘GO;DO Agentic Automation Platform’이라는 이름으로 풀어낸 자율형 엔터프라이즈 청사진이다. 단순한 RPA 회사의 신제품 발표라고 보기에는 구조가 꽤 무겁다. 문서·시스템·로그를 분석해 지식을 추출하고, 그 지식 위에서 에이전트가 업무를 수행하며, 그 결과가 다시 지식으로 환원되는 ‘지식 선순환’ 구조를 전면에 내세운 것이다.
이 발표를 읽으면서 들었던 솔직한 첫 인상은 두 가지였다. 하나는 “오픈클로 같은 글로벌 진영의 행동하는 AI 흐름이 한국 엔터프라이즈 시장에서도 본격적으로 그림이 그려지기 시작했구나”라는 것이었고, 다른 하나는 “이 그림을 그대로 구현하려면 LangGraph 멀티에이전트, RAG, OCR, 지식그래프, 휴먼 인 더 루프까지 거의 모든 에이전트 기술 스택이 한 번에 들어가야 한다”는 것이었다. 단순한 RPA 솔루션이 아니라, 사실상 하나의 AI 운영체제를 만들겠다는 시도다.
오늘 글에서는 이 GO;DO 플랫폼을 매개로 두 가지를 살펴보려 한다. 첫째, 한국형 에이전틱 자동화 모델이 어떤 모습으로 그려지고 있는지. 둘째, 멀티에이전트 시스템을 직접 굴려본 실무자 입장에서 이 구조가 합리적인지, 어디에 함정이 있는지. 미리 분명히 해두면 이 글은 특정 솔루션을 홍보하는 글이 아니다. 한국 시장에서 의미 있는 청사진이 등장했기에 그 구조를 뜯어보는 분석에 가깝다.
RPA에서 ‘Autonomous Enterprise’로, 무엇이 바뀌었나
김계관 대표 발표의 핵심 메시지는 한 줄로 정리된다. 기업 자동화가 더 이상 반복 업무 처리에 머무르지 않고, 지식을 구조화하고 실행하며 스스로 진화하는 ‘Autonomous Enterprise’ 단계로 나아가야 한다는 것이다. 표현 자체는 비전 슬로건처럼 들릴 수 있는데, 발표 내용을 자세히 보면 기술적으로 꽤 구체적이다.
먼저 자동화의 범위가 정형 업무를 넘어 문서, 화면, 음성, 레거시 UI까지 넓어지고 있다는 진단이다. 이건 RPA가 처음 등장했을 때의 좁은 범주를 한참 벗어난다. 초기 RPA는 정해진 화면에서 정해진 클릭을 자동화하는 데 머물렀다. 그런데 이제는 엑셀 한 줄을 읽고, PDF에서 표를 뽑고, 사내 메신저 대화를 이해하고, 콜센터 음성까지 처리해야 한다. 이렇게 입력의 형태가 다양해지는 순간, 규칙 기반 RPA만으로는 감당이 안 된다. 결국 LLM과 OCR, 음성 인식, 스크린 이해 같은 인지 기술이 자동화 스택의 기본값이 된다.
두 번째로 AI는 룰 기반 처리에 머무르지 않고 맥락을 이해해 실행하는 단계로 진화하고 있다는 진단이다. 이 부분은 이전에 RPA는 끝나지 않았다, 다만 진화했다 – 에이전틱 AI 전환의 실체 글에서 길게 다뤘던 내용과 정확히 맞물린다. RPA가 결정론적이라면 에이전틱 AI는 확률론적이다. 입력이 같아도 출력이 항상 같다는 보장이 없는 대신, 사람이 미리 정의하지 않은 새로운 상황에서도 판단을 내릴 수 있다.
세 번째로 사람은 검증과 승인, 판단에 집중하는 휴먼 인 더 루프 구조가 정착하고 있다는 점이 강조됐다. 이 휴먼 인 더 루프는 LangGraph 1.0에서도 가장 강조하는 프로덕션 기능 중 하나다. 시스템이 일시정지하고 사람의 입력을 기다리고, 응답이 오면 그 지점부터 재개하는 구조 말이다. 이걸 LangGraph 1.0 Supervisor 멀티에이전트 설계에서도 자세히 풀어둔 적이 있다. 즉, 그리드원이 말하는 휴먼 인 더 루프는 단순한 컨셉이 아니라 멀티에이전트 시스템의 표준 패턴으로 자리 잡고 있는 기술이다.
마지막으로 자동화가 기능 단위 제공을 넘어 실행과 검증, 운영이 연결된 플랫폼 중심으로 재편되고 있다는 진단이다. 이 마지막 항목이 사실상 GO;DO 플랫폼 전체 아키텍처를 정당화하는 명분이다.
GO;DO 플랫폼 구조를 멀티에이전트 관점에서 뜯어보면
발표에서 공개된 GO;DO 플랫폼 구조를 보면 크게 다섯 개의 레이어로 정리된다. 분석, 지식, 실행, 조율, 인터페이스다. 각 레이어를 멀티에이전트 시스템 설계 관점에서 해석해 보면 이 그림이 왜 이렇게 그려졌는지 더 잘 보인다.
분석 레이어에는 GO AiSE Analyzer, Task Miner, GO AI OCR이 자리한다. 문서, 시스템, 사용자 행위를 분석해 유즈케이스와 비즈니스 프로세스를 도출하는 역할이다. 멀티에이전트 시스템의 첫 번째 난관이 바로 이 분석 단계다. 기업 안에 이미 흩어져 있는 데이터를 에이전트가 먹을 수 있는 형태로 정제하지 않으면 그 위에 무엇을 올려도 작동하지 않는다. RAG 파이프라인을 직접 구축해 본 사람이라면 이 단계의 무게를 안다. 모델 선택보다 훨씬 더 많은 시간이 들어간다. 그리드원이 분석 도구만 세 개를 두고 시작하는 것 자체가 이 현실을 정직하게 인정하고 있다는 신호로 읽힌다.
지식 레이어에는 GO RAG, UC 저장소, 도메인 지식, 벡터DB, 지식그래프가 들어간다. 단순 검색이 아니라 업무 맥락 기반의 컨텍스트 엔진을 만들겠다는 구상이다. 발표 내용 중 인상적이었던 한 줄이 “정적 지식화에서 동적 지식화로 가는 핵심 축”이라는 표현이었다. 정적 지식화는 문서를 임베딩해 벡터DB에 넣어두는 일반적인 RAG에 가깝다. 동적 지식화는 그 위에 유즈케이스, 도메인 규칙, 시스템 관계를 연결한 지식그래프를 얹어 에이전트가 바로 실행 가능한 컨텍스트를 실시간으로 조립하는 단계다. 이 차이는 LangGraph 멀티에이전트 RAG에서도 길게 풀었던 부분이다. 결국 RAG는 검색 엔진이 아니라 추론 가능한 지식 인프라가 되어야 한다는 방향성이다.
실행 레이어에는 에이전트 빌더, 에이전트 팜, 툴 팜, GPT 팜, AutomateOne이 자리한다. ‘팜(Farm)’이라는 단어가 흥미롭다. 에이전트와 도구와 GPT 인스턴스를 모두 풀(pool) 형태로 관리하겠다는 발상이다. 이 구조는 에이전트가 늘어났을 때 라이프사이클 관리, 자원 할당, 권한 격리, 장애 격리를 모두 고려한 설계로 보인다. 에이전트 한두 개를 띄우는 것과 100개의 에이전트가 동시에 굴러가는 환경은 운영 난이도가 완전히 다르다. 단일 에이전트 데모는 일주일이면 만들지만, 100개의 에이전트가 안정적으로 협업하는 시스템은 1년이 걸린다.
조율 레이어인 GO;DO Agent Runtime은 멀티 에이전트를 조율하는 핵심이다. 발표에서 가장 추상화된 영역인데, 사실 이게 멀티에이전트 시스템 전체의 뇌다. LangGraph로 비유하면 Supervisor 노드와 라우팅 그래프를 모두 합친 역할이다. 어떤 에이전트가 어떤 작업을 받을지, 실패하면 어떻게 재시도할지, 결과를 어떻게 모아 다음 단계로 넘길지를 결정한다. 이 부분이 잘 설계되지 않으면 아래 모든 레이어가 무용지물이 된다.
인터페이스 레이어는 챗봇 UI, 휴먼 리뷰, 태스크 대시보드로 구성된다. 사람이 승인과 의사결정에 참여하는 통로다. 흥미로운 점은 챗봇 UI가 ‘메인 인터랙션’이라기보다 ‘여러 통로 중 하나’로 자리한다는 점이다. 휴먼 리뷰와 태스크 대시보드가 같은 레벨에 있다는 건, 사람이 단순히 챗봇과 대화하는 게 아니라 에이전트들의 작업 흐름을 모니터링하고 승인하는 관리자 역할을 한다는 의미다.
‘지식의 선순환’이라는 개념이 멀티에이전트에서 의미하는 것
발표에서 가장 흥미로웠던 개념이 ‘지식의 선순환’이었다. 기존 시스템의 UI와 소스코드, 로그를 역공학해 유즈케이스를 추출하고 이를 지식베이스에 저장한 뒤, 새로운 요구가 들어오면 관련 지식이 있는 경우 에이전트가 즉시 실행하고, 없는 경우에는 GO AiSE가 분석·설계·구현·테스트를 거쳐 새로운 기능을 만든다는 구조다. 그리고 이렇게 만들어진 결과는 다시 지식으로 환원돼 다음 자동화와 개발의 기반이 된다.
이 개념을 멀티에이전트 시스템 설계 관점에서 보면 사실상 ‘자가 진화하는 에이전트 네트워크’를 지향하는 그림이다. 일반적인 에이전트 시스템은 한 번 구축되면 거기서 끝난다. 새로운 업무 시나리오가 추가되면 사람이 다시 프롬프트를 짜고, 도구를 등록하고, 워크플로를 설계해야 한다. 그런데 그리드원이 말하는 선순환 구조는 에이전트가 자기 실행 결과로부터 새로운 지식을 추출하고, 그 지식이 다음 에이전트의 사전 지식이 된다는 것이다.
이 방향성 자체는 학계와 업계에서 한동안 화두였던 ‘Self-improving Agent’와 정확히 맞닿아 있다. 솔직히 말해 완전한 자가 진화는 아직 어렵다. LLM이 만들어낸 코드와 분석 결과를 검증 없이 다음 단계의 지식으로 흡수하면 환각이 누적되는 위험이 있다. 그래서 발표에서도 Critic Agent라는 검수 에이전트와 휴먼 리뷰가 함께 강조됐다. 이건 매우 중요한 설계 결정이다. 자가 진화를 표방하면서도 인간 검증 게이트를 빠뜨리지 않는 균형이 핵심인데, 이 균형이 무너지면 자동화가 오히려 새로운 리스크를 만든다.
내 경험상 멀티에이전트 시스템에서 가장 자주 망가지는 지점이 바로 이 ‘메모리’다. 에이전트가 과거 실행 결과를 어떻게 저장하고, 언제 다시 꺼내 쓰며, 잘못된 정보를 어떻게 폐기할지 정의하지 않으면 시간이 갈수록 시스템이 누적된 오류로 무거워진다. 그리드원이 ‘유즈케이스 저장소’, ‘도메인 지식’, ‘지식그래프’를 별도 레이어로 두고 그 위에 GO RAG를 올린 건 이 메모리 관리 문제를 진지하게 본 흔적이다.
OCR과 TaskMiner, ‘디지털화되지 않은 지식’을 끌어올리는 두 축
GO AI OCR과 TaskMiner도 따로 짚어볼 만하다. 두 도구 모두 한국 엔터프라이즈 자동화의 가장 큰 병목인 ‘디지털화되지 않은 지식’을 다루는 도구다.
GO AI OCR은 OCR과 VLM(Vision Language Model)을 결합한 하이브리드 방식으로 표와 도면, 복합 레이아웃까지 의미 단위로 추출하는 도구로 소개됐다. 이 방향이 매우 현실적이다. 한국 기업의 가장 큰 자산이자 가장 큰 골칫거리인 자료가 바로 HWP, PDF, 스캔 이미지 안에 갇힌 비정형 문서들이다. 단순 텍스트 추출 OCR은 표와 도면 앞에서 무너진다. 셀 병합, 결재란 주석, 수식 개체가 섞이면 파싱부터 꼬인다. VLM과 OCR을 결합하면 표의 구조 자체를 이해하고, 도면의 의미적 단위를 끌어낼 수 있다. 게다가 검수가 필요한 부분만 사람에게 넘기는 부분 검수 구조까지 짜놨다는 점이 인상적이다. 모든 문서를 사람이 다 검수하면 비용 효율이 떨어지고, 모든 문서를 자동 처리하면 정확도가 떨어진다. 그 사이의 절충점을 찾는 게 OCR 자동화의 핵심이다.
TaskMiner는 사람의 업무 수행 방식을 데이터화해 시스템이 스스로 학습하게 만드는 기술이다. 사용자의 실제 행위가 자동화 데이터가 되고, 개발자의 행위가 테스트와 검증 데이터가 된다는 설명이다. 이 발상이 또 흥미롭다. 그동안의 RPA는 사람이 봇에게 일을 가르치는 구조였다. “여기 클릭, 저기 입력, 이 셀 복사” 식으로 하나하나 녹화했다. 그런데 TaskMiner 방향은 반대다. 사람이 평소처럼 일하면, 그 행위가 백그라운드에서 데이터로 쌓이고, 시스템이 그 데이터에서 패턴을 추출해 자동화 시나리오를 역으로 만들어낸다.
이 접근의 가치를 실무자 관점에서 짧게 정리하면, 자동화의 진입 장벽을 사람 쪽에서 낮춘다는 것이다. 기존 RPA 도입은 IT 부서나 자동화 전문가에게 의존했다. 현업 직원은 자기 업무를 스크립트로 표현하는 능력이 없었다. TaskMiner 방향은 이 의존을 끊는다. 현업 직원은 그냥 평소처럼 일하면 된다. 자동화는 시스템이 알아서 만들어낸다. 물론 실제로 이 약속이 얼마나 잘 작동하는지는 도입 사례를 검증해야 한다. 그러나 방향성 자체는 정확하다.
AutomateOne AI와 ‘API가 없는 시스템’ 문제
AutomateOne AI에 대한 설명도 짚어둘 필요가 있다. API나 MCP로 직접 연결하기 어려운 시스템까지 UI 조작을 그대로 재현해 자동화하는 도구로 소개됐다. 다른 말로 RPA의 강점인 ‘화면 자동화’를 에이전틱 AI 시대의 자동화 사각지대 메우기 도구로 재정의한 것이다.
이 부분이 한국 시장에서 특히 의미가 큰 이유가 있다. 한국 엔터프라이즈에는 아직도 API가 없는 레거시 시스템이 정말 많다. 90년대~2000년대 초반에 구축된 사내 그룹웨어, 회계 시스템, 생산관리 시스템 중 상당수가 API 없이 화면으로만 접근 가능한 형태다. 이런 환경에서 에이전트가 일하려면 결국 화면 자동화가 필요하다. MCP로 깨끗하게 연결되는 모던 SaaS 환경만 가정한 에이전트 솔루션은 한국 엔터프라이즈에서 즉시 한계를 드러낸다.
이 지점이 Node.js가 AI 에이전트의 미래다 – Flowise, LangChain, LangGraph 실제 프로덕션 사례 글에서 정리했던 한국 시장 특수성과 정확히 맞물린다. 글로벌 에이전트 프레임워크가 깨끗한 API 환경을 가정하고 만들어진 반면, 한국 엔터프라이즈 시장은 API가 없는 레거시와 화면 자동화 자산이 함께 굴러가는 곳이다. 이 환경을 인정하고 그 위에서 에이전트와 RPA를 결합한 그리드원의 접근은 사실 매우 실용적이다.
GO AiSE, 자율 개발 엔진이 의미하는 것
발표의 또 다른 큰 축이 소프트웨어 개발 자동화 플랫폼 GO AiSE였다. 레거시 시스템 분석부터 설계, 개발, 테스트, 검증까지 소프트웨어 생명주기 전반을 아우르는 통합 플랫폼이라는 설명이다. Analyzer는 문서 없이도 소스코드만으로 레거시 시스템을 분석해 숨겨진 비즈니스 프로세스와 유즈케이스를 복원하고, Developer는 분석 결과를 바탕으로 분석·설계·코딩 단계의 산출물을 생성하며, Tester는 결과를 다시 검증한다. Critic Agent가 AI 생성 결과를 실시간으로 검수·점수화한다.
이 구조가 전 세계적으로 주목받는 ‘AI 코딩 에이전트’ 흐름과 어떻게 다른지가 차별 포인트다. 일반적인 AI 코딩 도구는 파일이나 함수 단위의 코드 생성을 지원한다. 개발자가 IDE에서 함수 하나를 만들 때 보조 역할을 한다. GO AiSE는 그 단위를 유즈케이스로 끌어올렸다. 비즈니스 스펙과 시스템 구현을 연결하는 핵심 중추를 유즈케이스로 본 것이다. 아이디어는 빠르게 시스템으로 구현되고, 시스템은 다시 비즈니스 스펙으로 복원될 수 있다는 양방향 구조가 핵심이다.
여기서 솔직한 평가를 한 가지만 덧붙이면, 이런 자율 개발 엔진은 데모와 실전의 간극이 가장 큰 영역 중 하나다. 발표 자료로 보면 매끄럽게 작동하는데, 실제 레거시 시스템 분석에 들어가는 순간 코드 안에 묻혀 있는 암묵적 비즈니스 룰, 시간이 지나면서 누적된 패치, 문서화되지 않은 우회 로직 같은 것들이 끝없이 튀어나온다. 이걸 자동으로 복원하겠다는 야심은 매우 높은 기준이고, 솔직히 100% 자동화는 어렵다. 다만 50~70% 정도 복원해주는 도구만 있어도 개발자 한 명이 한 달에 끝낼 일이 일주일로 줄어든다. 이 정도만 해도 시장 가치는 충분하다.
테스트 자동화 부분에서 GO AiSE Tester가 개발자의 테스트 행위를 자동 기록하고, LLM이 그 행위 시퀀스에서 테스트 의도를 추론·구조화한 뒤 이를 재사용 가능한 자동화 테스트 스크립트로 전환한다는 설명도 흥미로웠다. 개발자의 암묵적 테스트 노하우를 조직의 명시적 자산으로 바꾸는 발상이다. 이건 사실 모든 SI 회사의 오랜 숙원이었다. 시니어 개발자가 퇴사할 때마다 그가 쌓아둔 테스트 감각이 사라지는 문제 말이다.
그래서 이 그림은 한국 시장에서 의미가 있는가
여기까지 뜯어본 GO;DO 플랫폼을 한 줄로 평가하라면 이렇게 정리하고 싶다. 한국 엔터프라이즈 환경의 현실을 정직하게 인정한 위에서, 글로벌 에이전틱 AI 흐름을 자기 방식으로 재해석한 그림이다.
긍정적으로 평가할 수 있는 지점이 세 가지 있다.
첫째, RPA를 버리지 않고 에이전트의 실행 도구로 흡수한다는 방향이다. 한국 엔터프라이즈에 이미 깔린 RPA 자산을 무시하고 처음부터 다시 짜라고 강요하면 시장이 움직이지 않는다. RPA를 도구화하고 그 위에 에이전트 오케스트레이션을 얹는 구조는 현실적인 전환 경로다. 이 부분은 RPA에서 에이전틱 AI로의 전환 글에서도 강조했던 결론과 정확히 맞물린다.
둘째, 한글 문서, 비정형 데이터, 레거시 화면 같은 한국 특유의 자동화 사각지대를 정면으로 다룬다는 점이다. GO AI OCR의 VLM 결합, AutomateOne AI의 화면 자동화, TaskMiner의 행위 데이터화 같은 도구들이 모두 이 사각지대를 커버하는 데 초점이 맞춰져 있다.
셋째, 휴먼 인 더 루프와 Critic Agent를 통한 검증 게이트를 명시적으로 설계에 포함했다는 점이다. 자율 진화를 표방하면서도 환각 누적의 위험을 인정하는 균형 감각이다.
물론 우려되는 지점도 분명하다. 첫 번째는 복잡도다. 다섯 개 레이어, 수십 개 모듈을 한 플랫폼 안에 올리는 만큼, 도입 기업 입장에서는 학습 곡선과 운영 부담이 만만치 않을 수 있다. 둘째는 검증이다. 발표에 등장한 청사진이 실제 도입 사례에서 어느 수준까지 작동하는지는 별개의 문제다. 셋째는 락인이다. 한 플랫폼 위에서 분석부터 실행까지 모두 처리하는 구조는 효율적인 만큼 다른 플랫폼으로의 이전이 어렵다.
한국형 에이전틱 자동화의 좌표가 그려지고 있다
이번 발표를 그저 한 회사의 신제품 발표로 보기에는 시사점이 크다. 그동안 한국 엔터프라이즈 자동화 시장은 글로벌 RPA 솔루션의 그림자 아래에서 움직였다. 그리고 에이전틱 AI라는 새 흐름 앞에서, 한국 시장은 또다시 글로벌 모델을 그대로 따라갈지 아니면 자기 환경에 맞는 모델을 만들어낼지의 갈림길에 있었다.
GO;DO 플랫폼이 그 답이라고 단정할 수는 없다. 그러나 적어도 ‘한국형 에이전틱 자동화’라는 좌표를 누군가가 명시적으로 그리기 시작했다는 점에서 의미가 있다. 정형 업무를 넘어 한글 문서와 레거시 화면까지 끌어안고, RPA 자산을 폐기하지 않고 흡수하며, 분석-지식-실행-검증을 하나의 선순환 고리로 묶는 청사진. 이 그림이 실제 시장에서 얼마나 작동할지는 앞으로의 도입 사례가 검증할 것이다.
마지막으로 실무자 관점에서 한 가지를 덧붙이고 싶다. 글로벌 멀티에이전트 프레임워크인 LangGraph, MCP, Vertex AI Agent Builder 같은 도구들이 만드는 흐름과, 한국형 자동화 플랫폼이 만드는 흐름은 결국 같은 곳을 향한다. 에이전트가 사람의 업무를 이해하고, 도구를 호출하며, 결과를 검증받고, 다시 학습하는 자율형 시스템. 다만 그 자율성을 어떤 환경 위에서 구현하느냐가 다르다. 한국처럼 한글 문서와 레거시가 함께 굴러가는 환경에서는 글로벌 표준 그대로보다는, 그 환경에 맞춘 변형이 살아남는다.
그래서 지금 이 시점에 한국 엔터프라이즈 의사결정자들이 던져야 할 질문은 명확하다. 우리 회사의 데이터와 시스템과 업무는 어떤 모습인가. 글로벌 표준 에이전트 플랫폼 위에서 그 모습이 자연스럽게 작동하는가, 아니면 한국형 변형이 필요한가. 이 질문에 답할 수 있는 조직이 향후 3~5년의 자동화 사이클에서 앞서 나간다. GO;DO 같은 청사진은 그 질문에 대한 하나의 답안지로 참고할 가치가 충분하다.