KEDA를 활용한 로그 시스템 오토스케일링 경험담

우아한형제들은 KEDA를 활용하여 100만 TPS의 로그 시스템에 오토스케일링을 성공적으로 적용하였습니다. 이 경험을 통해 로그 처리의 변동성을 관리하며 비용 효율성을 높이는데 기여하게 되었습니다. 본 문서에서는 KEDA 도입 과정과 실제 운영 사례를 통한 운영 환경 개선 방안에 대해 설명합니다. KEDA 적용을 통한 로그 시스템 아키텍처 변화 KEDA를 도입하기 전, 우아한형제들은 기존 HPA를 이용하여 로그 시스템의 오토스케일링을 시도했습니다. 하지만 평균 CPU 및 메모리 사용량을 기준으로 스케일링이 진행되면서 한계에 봉착하게 되었습니다. KEDA의 도입 이후, 이벤트 기반으로 스케일링을 설정함으로써, 로그 시스템의 아키텍처를 유연하게 설계할 수 있었습니다. KEDA는 다양한 이벤트 소스를 지원하여 로그 시스템의 특성에 맞는 스케일링 기준을 설정할 수 있게 해줍니다. 예를 들어, Fluentd의 버퍼 사용률을 기준으로 스케일링 트리거를 설정함으로써, 시스템이 실제로 부하를 받기 시작하기 전에 프로세스를 조정할 수 있었습니다. 이는 로그 처리의 안정성을 크게 향상시켰고, 유연한 리소스 관리로 비용을 줄일 수 있는 기반을 마련하였습니다. 이러한 변화는 로그 시스템 아키텍처의 효율성을 높이고, 운영 환경을 개선하는 데에 결정적인 역할을 했습니다. 다양한 메트릭을 조합하여 스케일링 미세 조정이 가능해짐으로써, 시스템 부하가 예상되는 피크 시간대에도 원활하게 처리할 수 있는 역량을 갖추게 되었습니다. KEDA 도입을 통한 메트릭 기반 스케일링 효과 KEDA의 도입은 로그 시스템의 메트릭 기반 스케일링을 가능하게 하였습니다. 기존 HPA와 달리, KEDA는 프로메테우스를 이용해 다양한 지표를 직접적으로 활용할 수 있게 해줍니다. 이를 통해 CPU 및 메모리 사용량 외에도 Fluentd 버퍼와 같은 중요한 메트릭을 스케일링 기준으로 설정할 수 있었습니다. Fluentd의 버퍼가 일정 사용률을 초과할 경우 이를 위기 상황으로 간주하여 스케일 아웃을...

B마트 OMS를 통한 퀵커머스 출고 최적화


우아한형제들이 운영하는 B마트의 OMS(Order Management System)는 퀵커머스 출고 최적화를 통해 물류 운영을 혁신했습니다. 이를 통해 고객, 라이더, 현장 작업자의 경험을 모두 개선하는 통합적인 솔루션을 제공하며, 서비스의 신뢰도를 높였습니다. 본 글에서는 B마트 OMS의 기능과 성과를 살펴보겠습니다.

B마트 OMS의 역할과 중요성

B마트의 OMS는 단순한 주문 처리 시스템을 뛰어넘어 전체 물류 운영을 관리하는 효율적인 플랫폼입니다. 이 시스템은 고객의 주문이 어떻게 처리되는지를 전방위적으로 최적화하여, 고객에게 물리적이고 심리적으로 신뢰 있는 경험을 제공합니다. 즉, OMS는 주문 흐름 제어, 판매 재고의 통합 관리, 그리고 작업 효율 데이터를 분석하여 배송 서비스의 질을 높이는 데 기여합니다.


이 시스템의 중요한 기능 중 하나는 주문 흐름의 체계적인 제어입니다. 이를 통해 고객의 주문이 어떻게 처리되는지를 실시간으로 확인할 수 있으며, 이는 고객에게 더욱 높은 신뢰를 줍니다. OMS는 가용 재고를 실시간으로 반영하여, 고객이 품절 상태에서 오는 불만을 줄여줍니다. 특히, 피크타임에는 출고 요청이 일시에 몰리는 경향이 있어, 출고 인력이 부족한 상태에서 혼란이 발생할 수 있기 때문에 OMS는 피크 매니지먼트를 위해 예약 배달 주문을 유휴 시간대에 분산 처리하는 방식으로 효율성을 극대화합니다.


예약배달의 효율적인 출고 최적화

2025년 상반기에는 예약배달의 출고 요청을 유휴 시간대에 분산시키기 위한 피크매니지먼트 프로젝트가 진행되었습니다. 이 프로젝트의 주요 목적은 피크 시간대에 몰리는 주문의 수를 줄이며 효율적인 출고 환경을 조성하는 것이었습니다. 이를 위해서 OMS는 기존의 출고 요청과 배달 요청을 분리하여, 고객의 수령 시각에 맞춰 배송을 조정하는 데 초점을 맞췄습니다.


이러한 접근 방식은 고객에게도 긍정적인 영향을 미쳤습니다. 고객이 선택한 수령 시각을 절대적으로 보장하면서, 출고 현장의 작업 효율을 높이는 동시에 높은 품질의 서비스를 제공할 수 있었습니다. 결과적으로 이 시스템은 평균 출고 처리 시간을 약 19% 단축시키며 고객의 만족도를 크게 향상시켰습니다. 이렇게 출고 최적화는 단순히 고객에게 신뢰를 제공하는 데 그치지 않고, 각 현장 작업자의 피로도도 감소시키는 다면적인 효과를 가져왔습니다.


동적 출고예정시각의 개선 효과

또한, OMS에서는 라이더의 대기 시간을 최소화하기 위해 출고예정시각을 동적으로 산정하는 로직이 개발되었습니다. 기존의 고정된 출고예정시각 방식은 현장의 실제 여건을 전혀 반영할 수 없었기 때문에, 많은 불만을 초래했습니다. 이러한 문제를 해결하기 위해 출고 가능 인원과 생산성을 기반으로 실시간으로 예상 소요 시간을 계산하는 시스템을 구축하였습니다.


이 시스템은 라이더와 고객 모두에게 긍정적인 경험을 제공했습니다. 라이더가 픽업하러 왔을 때 대기하는 시간이 현저히 줄어들었으며, 실제로 라이더의 평균 대기 시간을 86.67% 이상 감소시킨 성과를 가져왔습니다. 또한, 출고예정시각과 실제 출고 완료 간의 편차를 크게 줄여, 서비스의 신뢰성을 한층 더 높이는 결과를 얻었습니다. 이는 B마트의 전체 배송 품질을 향상시키는 중요한 요소 중 하나로 자리잡았습니다.


결론적으로, B마트 OMS는 물류 운영을 효율적으로 개선하기 위한 강력한 도구로 기능하고 있으며, 고객과 라이더, 작업자 모두에게 높은 가치를 제공합니다. 이어지는 단계에서는 OMS의 지속적인 발전을 통해 더욱 빠르고 정확한 서비스를 제공할 수 있는 방안을 모색하고 있습니다.

```

이 블로그의 인기 게시물

우아한형제들의 실시간 알림 혁신: SSE(Server-Sent Events)로 이룬 효율성과 안정성

물어보새의 진화와 지식 공유 확장

우아한 디버깅 툴 개선으로 QA 업무 효율화