분산 추적을 사용하면 여러 애플리케이션의 마이크로서비스에서 사용자 트랜잭션 실행을 추적할 수 있습니다. 이를 통해 마이크로서비스에 대한 응답 속도 저하 및 오류를 정확하게 파악하여 트랜잭션 수명을 쉽게 시각화하고 이해할 수 있습니다.
Illuminate에서 진행한 프레젠테이션에서는 애플리케이션 성능 사례에 활용할 수 있도록 Sumo Logic 플랫폼을 확장했다고 말씀해 드렸습니다. Sumo Logic은 분산 추적을 직접 활용할 수 있도록 함으로써 모든 엔드 투 엔드 안정성 요구 사항을 만족하는 관찰 가능성(Observability) 플랫폼이라고 할 수 있습니다.
Sumo Logic 엔드 투 엔드 관찰 가능성(Observability) 플랫폼의 이점을 이해하려면 먼저 현재 대부분의 기업이 마이크로서비스와 인프라에 대한 완벽한 가시성을 얻기 위해 어떻게 노력하고 있는지 살펴봐야 합니다.
데이터 수집 추적 시 어려운 점
대부분의 기업은 추적을 통해 애플리케이션 성능 데이터를 완벽하게 파악하는 것이 중요하다는 사실을 알지만, 문제는 '블랙 박스'식 공급업체가 추적 데이터를 수집할 때 특정 도구를 필요로 하는 데에 있었습니다. 이러한 단점으로 인해 기업은 해당 공급업체에 종속되고 통합이 지연되었으며 애플리케이션을 빌드하는 방식과 모니터링 방식도 공급업체에 따라 결정되었습니다.
Sumo Logic 고객들과 대화한 결과, 추적 데이터 수집에 관해서는 오픈 소스 방식을 선호하는 기업의 수가 압도적으로 많았습니다. 업계 추세에 따르면 몇 년 안에 새로운 마이크로서비스 기반 애플리케이션의 절반이 공급업체별 에이전트 대신 오픈 소스 도구를 사용할 것으로 보이며, 전문 분석가들은 새로운 추적 수집 표준인 OpenTelemetry를 가능한 한 빨리 도입할 것을 권장합니다. OpenTelemetry는 자유롭고, 유연하며, 안전합니다.
Sumo Logic을 분산 추적에 적용할 수 있도록 확장할 때 기존의 OpenTracing 및 OpenCensus 표준과 함께 OpenTelemetry도 완전히 지원됩니다. 따라서 도입 과정은 매우 간단합니다. 익스포터 설정을 Sumo Logic의 OpenTelemetry 수집기로 변경하기만 하면 추적 데이터를 Sumo Logic의 새로운 UI로 가져올 수 있습니다.
하나의 플랫폼에서 엔드 투 엔드 관찰 가능성(Observability) 제공
이미 출시된 기능과 베타 기능이 모두 포함된 이 데모에서 볼 수 있듯이, 엔드 투 엔드 관찰 가능성(Observability) 플랫폼은 추적 데이터를 사용하여 애플리케이션 성능 문제를 모니터링하고 해결하는 데 핵심적인 요소입니다.
Sumo Logic의 관찰 가능성(Observability) 플랫폼은 모든 애플리케이션 관련 문제를 해결할 수 있는 단일 플랫폼, 단일 UI, 단일 제품을 제공합니다. 인프라 탭을 사용하면 언제든지 다른 대시보드, 로그, 추적 또는 메트릭으로 쉽게 이동할 수 있습니다. 모든 신호들을 연결하는 것은 어려운 일이지만, Sumo Logic은 고객을 위해 백엔드에서 힘든 작업을 수행합니다. 또한, Sumo Logic은 브라우저 모니터링 및 범위 분석과 같은 기능도 곧 추가하기 위해 노력하고 있습니다.
Sumo Logic 관찰 가능성(Observability) 플랫폼의 전반적인 기능은 Sumo Logic의 현재 활용 사례를 기반으로 하여 자연스럽게 확장된 것으로, 플랫폼의 나머지 부분에 독립형 제품을 연결하는 것과는 완전히 다릅니다. 이 제품은 개방적이고 유연하며, 확장 가능하고 안전합니다. 또한 고객이 Sumo Logic에서 로그 및 메트릭과 관련하여 이미 이용하고 있는 것과 동일한 우수한 통합 분석 기능을 제공합니다.
단일 플랫폼에서 모든 기능을 이용할 수 있으므로 고객은 애플리케이션 성능 활용 사례에 대해 완벽한 관찰 가능성(Observability)을 확보할 수 있습니다. 고객이 얻을 수 있는 이점은 다음과 같습니다.
- 마이크로서비스 상태에 대해 완벽한 가시성을 제공하는 대시보드를 통해 데이터 집계
- 플로우 다이어그램 또는 토폴로지 맵(현재 베타)을 활용하여 인프라 KPI와의 상관 관계를 분석하고 애플리케이션 종속성을 추적
- 오류가 있거나 느린 트랜잭션을 검색하고 로그 및 인프라 KPI에 대한 심층 검색을 통해 문제 해결
제품에 대한 자세한 내용은 여기를 참조하세요.
Elementum: Sumo Logic 베타 이용 사례
Norberto Kueffner는 공급망 관리 소프트웨어 회사인 Elementum의 사이트 안정성 엔지니어링 매니저입니다.
일반적인 경우 그의 팀은 DC/OS 및 Kubernetes 오케스트레이터가 지원하는 복잡한 마이크로서비스 아키텍처를 다룹니다. 이 팀은 배송 정보부터 지도상의 위치 및 지점까지 많은 고객 데이터를 취급하기 때문에 여러 개의 인터페이스를 통해 데이터가 수집되는 복수의 파이프라인을 필요로 합니다. 또한 애플리케이션도 멀티 테넌트 방식이므로 사용자는 해당 오케스트레이터가 지원하는 모든 마이크로서비스의 각 코어에 대한 각 서명을 검증해야 하는 등, 서로 다른 요구 사항을 가진 여러 기업과 협력하여 플랫폼에 풍부한 데이터를 생성할 수 있습니다. 이러한 이유 때문에 이 회사에게 있어 추적은 매우 중요한 과제입니다.
애플리케이션에 대한 엔드 투 엔드 가시성을 개선하기 위해 Sumo Logic 베타를 사용하기 전에는 이 회사의 추적, 앱 성능 모니터링 및 메트릭 공급업체가 모두 달랐습니다. 이러한 상황에서는 다음과 같은 문제를 계속 처리해야 합니다.
- 서로 다른 공급업체와의 대규모 계약
- 개발자를 위한 이중 교육
- 다중 인터페이스/구성
- 추적/로그/호스트/문제의 상관 관계 분석 시 어려움
- 다수의 에이전트/수집기/설정 관리
Elementum의 SR 팀은 이러한 문제의 해결을 염두에 두고 분산 추적에서 관찰 가능성(Observability) 확장 기능을 앞서 도입한 Sumo Logic을 사용해 보았습니다.
팀은 추적 이벤트를 수집하기 위해 OpenTelemetry를 사용했으며 아무런 문제도 겪지 않았습니다. Norberto는 공급업체 기반 수집기를 사용할 필요가 없어 훨씬 더 쉽고 간단했다고 답변했습니다. EKS 클러스터에서 데이터를 수집하고 Sumo Logic에 대시보드를 구성하는 작업은 한 번만에 성공적으로 완료되었으며, 대시보드는 자동으로 구성되었습니다.
플랫폼 내부적으로 개발자들은 탁월한 통합 수준, 특히 Sumo Logic 내에서 구현된 직관적인 범위 시각화 및 검색을 보고 즉각적인 가치를 인정했습니다. 이벤트 추적에서 이벤트 로깅, 인프라 장애 및 병목 현상 확인, 다른 공급업체 스택에서는 경험하지 못한 높은 수준의 가시성 등 모든 것이 단 두 번의 클릭만으로 가능합니다.
덕분에 팀은 새로운 기능, 수정 및 개선 사항을 보다 쉽게 출시할 수 있었으며, 이제 통합 문제 또는 병목 현상의 근본적인 원인을 이전보다 훨씬 빠르고 쉽게 찾고 있습니다. 이전에는 두세 개의 서로 다른 공급업체 플랫폼을 이동해야 했지만 Sumo Logic에서는 그냥 원하는 항목을 클릭해서 추적하기만 하면 됩니다.
Elementum 팀은 탁월한 베타 경험에 만족하여 이제 Sumo Logic의 스테이징 및 프로덕션 환경으로 전환했으며, 더 이상 관찰 가능성(Observability) 요구 사항을 위해 다양한 공급업체의 여러 솔루션을 사용하지 않아도 됩니다.
Complete visibility for DevSecOps
Reduce downtime and move from reactive to proactive monitoring.