반복영역 건너뛰기
주메뉴 바로가기
본문 바로가기
제품/서비스
EMS Solution
Features
클라우드 관리
서버관리
데이터베이스 관리
네트워크 관리
트래픽 관리
설비 IoT 관리
무선 AP 관리
교환기 관리
운영자동화
실시간 관리
백업 관리
스토리지 관리
예방 점검
APM Solution
애플리케이션 관리
URL 관리
브라우저 관리
ITSM Solution
서비스데스크
IT 서비스 관리
Big Data Solution
SIEM
AI 인공지능
Dashboard
대시보드
Consulting Service
컨설팅 서비스
고객
레퍼런스
고객FAQ
문의하기
가격
자료실
카탈로그
사용자매뉴얼
회사소개
비전·미션
연혁
2016~현재
2000~2015
인증서·수상
투자정보
재무정보
전자공고
IR자료
새소식
공고
보도자료
오시는 길
채용
피플
컬처
공고
FAQ
블로그
열기
메인 페이지로 이동
블로그
최신이야기
블로그
최신이야기
사람이야기
회사이야기
기술이야기
다양한이야기
쿠버네티스와 Helm 등 CNCF의 주요 프로젝트
[행사] 브레인즈컴퍼니 신년회, 2023년을 돌아보고 2024년을 내다보다
이화정
2024.01.05
페이스북 공유하기
트위터 공유하기
링크드인 공유하기
블로그 공유하기
테라폼(Terraform)의 모든 것, 그리고 AWS EC2 생성하기
브레인저들의 새해를 여는
2024년 신년회
가 지난 4일(목) 본사 8층 라운지에서 열렸습니다.
오랜만에 브레인저 모두가 모인 자리에서 2023년을 돌아보고, 2024년을 함께 내다보는 시간을 가졌습니다. 그리고 장기근속자, 우수팀, 승진을 발표하고 축하하는 시간과 고기파티까지 열렸는데요! 신년회의 생생한 현장을 지금부터 살펴보겠습니다.
。。。。。。。。。。。。
[16:00]
2023년을 돌아보고 2024년을 내다보다
브레인즈컴퍼니의 각 분야를 담당하고 있는 본부장님들의 발표로 본격적인 신년회가 시작되었습니다.
첫 번째 순서는 전략사업본부의 은숙님이 맡아주셨습니다. 은숙님은 9부터 시작해서 1까지 각 숫자와 연관되어 있는 내용으로 2023년 회고와 2024년 계획을 말씀해 주셨습니다. 브레인즈컴퍼니의 영업
·
마케팅
·
고객관리를 총괄하고 계신만큼, 많은 고민과 진심이 담긴 발표였습니다!
은숙님은 발표를 통해
“2023년 어려운 시장 환경 가운데서도 모두 노력해서 많은 고객을 만나고 소프트웨이브같은 큰 행사도 성공적으로 치렀던 것 처럼, 2024년에도 모든 브레인저가 힘을 합치면 목표보다 더 높은 곳에 오를 수 있을 것”
이라고 강조해 주셨습니다.
다음으로 브레인즈컴퍼니의 중심! 개발그룹을 대표해서 자환님이 발표를 진행해 주셨습니다. 자환님은
“2023년에 빠르게 변화하고 있는 IT 환경과 고객 니즈에 맞춘 서비스를 지속적으로 개발하고 배포했다. 2024년에도 기존 출시된 쿠버네티스(Kubernetes) 모니터링 제품의 기능 고도화를 포함하여, 완성도 높은 기능과 서비스들을 선보일 계획”
이라고 밝혀주셨습니다.
마지막으로 경영지원팀 현보님은
“지난해 만족도가 높았던 해외연수(만족도 4.43/5)와 패밀리데이(만족도 4.56/5)를 포함하여, 2024년에는 더 다양한 행사와 교육 등을 통해 건강한 사내 문화를 만들겠다. 또한 브레인저들의 능력을 높일 수 있도록 지속적으로 노력하겠다”
라고 포부를 밝혀주셨습니다.
이렇게 각 본부별 2023년 회고와 2024년 비전을 알아볼 수 있었는데요. 본부장님들이 발표 중간중간 감사하고 수고했던 브레인저분들께, 진심 어린 감사의 마음을 전하며 마음이 따뜻해 지기도 했습니다.
[16:45]
재걸님의 총평 “2024년 우리가 꼭 기억해야 할 것은”
다음 순서로 브레인즈컴퍼니의 운영을 총괄하시는 재걸님(부사장)께서 2023년 한 해를 되돌아보는 총평과, 2024년 계획에 대해 발표하는 시간을 가졌습니다.
우선 2023년에 어려운 경제환경 속에서도 제니우스(Zenius)의 고객이 꾸준히 증가한 것과 큰 행사를 잘 마무리한 것, 그리고 쉬지 않고 새로운 서비스 개발에 힘쓴 것에 대해 격려해 주셨습니다.
2024년에는 브레인즈컴퍼니가 더 높이 도약할 수 있도록 Zenius의 경쟁력을 높이고, 자회사인 에이프리카와의 협업을 강화할 것을 강조하셨습니다.
[17:20]
깜짝 ‘나락’퀴즈쇼!
잠시 분위기를 바꿔 브레인즈 나락 퀴즈쇼도 진행됐습니다. 퀴즈를 맞추거나, 틀려도 나락(?)에 갈 수 있는 위험하고 재밌는 시간이었는데요. 한 분을 제외하곤 모두 정답을 맞춰주셨습니다
(자세한 내용 해당 브레인저들의 더 이상의 추락을 막기 위해 비공개로..)
. 이 퀴즈쇼를 통해 모든 브레인저가 함께 웃을 수 있었던 시간이었습니다.
[17:40]
각종 포상 수상식
다음으로는 각종 포상 및 승진자를 발표하고 축하하는 시간이 이어졌습니다. 먼저 장기근속자(5/10/15)들에 대한 포상이 진행되었는데요. 여기서 깨알 복지!
*브레인즈컴퍼니는 5년 근속자는 현금 100만 원 지급, 10년 근속자는 현금 300만 원과 휴가 3일 지급, 15년 근속자는 500만 원과 휴가 5일을 지급합니다.
다음으로는 2023 최우수 부서(디자인팀), 협력지원 포상에 이어 승진자 발표가 이어졌습니다. 모두 진심으로 축하드립니다?
[18:00]
신년회의 ‘꽃’ 회식
신년회에는 맛있는 음식이 빠질 수 없죠! 팀원들 간의 행복한 저녁 시간을 보내기 위해 근처 고깃집으로 향했는데요. 큰 규모의 식당을 단독으로 대관해 편하게 즐길 수 있었습니다.
팀원분들끼리 그간 못 했던 말들도 하고, 포상과 승진을 한 브레인저에게 서로 축하 인사를 하며, 회포를 푸는 시간을 가졌습니다.
이번 신년회를 통해 2023년 한 해를 되돌아보고, 2024년을 희망차고 행복하게 시작할 수 있었습니다. 무엇보다 브레인저분들이 함께 있어 더 뜻깊었던 시간이었습니다!
이렇게 브레인즈컴퍼니의 2024년은 힘차게 시작되었습니다.
#신년회
#사내문화
#사내복지
#행사
이화정
프리세일즈팀
프리세일즈팀에서 마케팅, 내외부 홍보, 콘텐츠 제작을 담당하고 있어요.
필진 글 더보기
목록으로
추천 콘텐츠
이전 슬라이드 보기
쿠버네티스 모니터링 솔루션, Zenius K8s의 주요기능과 특장점
쿠버네티스 모니터링 솔루션, Zenius K8s의 주요기능과 특장점
많은 기업이 Kubernetes(K8s)를 통해 애플리케이션을 대규모로 배포하고 관리하면서, 이에 맞는 모니터링 솔루션의 중요성이 더욱 커지고 있습니다. 멀티 클러스터 환경이 확산되고 애플리케이션과 인프라 요소가 긴밀히 연결된 IT 인프라에서는, 리소스 상태를 실시간으로 파악하고 신속하게 대응할 수 있는 모니터링이 필요하기 때문입니다. 이러한 상황에서 Zenius K8s는 멀티 클러스터 통합 관리, 애플리케이션 성능 분석, 연관 장비 모니터링 등 다양한 기능을 제공합니다. Kubernetes 환경을 더욱 효과적으로 관리하게 해주는 Zenius K8s의 주요기능과 특장점을 알아보겠습니다. Zenius K8s의 주요기능 [1] 멀티 클러스터 통합 모니터링 쿠버네티스 환경에서는 여러 클러스터를 동시에 관리해야 할 상황이 빈번하게 발생합니다. Zenius K8s는 멀티 클러스터 환경을 단일 화면에서 통합해서 관리할 수 있는 기능을 제공하여, 운영자가 각 클러스터의 상태를 손쉽게 모니터링할 수 있도록 지원합니다. 특히, 자동 생성되는 Topology Map은 클러스터 내부 구성 요소(Node, Pod, Container) 간의 관계를 직관적으로 시각화합니다. 이를 통해 운영자는 각 구성 요소의 연관성과 의존성을 명확히 이해할 수 있으며, 잠재적인 문제를 빠르게 식별할 수 있습니다. 이러한 시각적 도구는 운영자가 복잡한 구조를 보다 체계적으로 관리하는 데 중요한 역할을 합니다. [전체 클러스터 운영 요약 화면 예시] Zenius K8s는 또한, 클러스터별 주요 성능 지표를 요약한 화면과 세부 데이터를 확인할 수 있는 상세 데이터 화면을 제공합니다. 요약 화면에서는 클러스터 간의 성능 차이를 비교 분석할 수 있으며, 세부 데이터 화면에서는 개별 클러스터 내 특정 구성 요소의 성능 문제를 심층적으로 분석할 수 있습니다. 예를 들어, 특정 클러스터에서 리소스 사용량이 급증하는 현상을 요약 화면에서 확인한 후, 상세 데이터 화면으로 전환해 어떤 Pod나 노드가 문제의 원인인지 정확히 파악할 수 있습니다. 이러한 데이터 기반의 접근 방식은 운영자가 적절한 대응 조치를 빠르게 취할 수 있도록 합니다. [2] 지능형 장애 탐지 및 신속한 대응 지원 Zenius K8s는 쿠버네티스의 기본 이벤트 관리 기능을 확장하여, Kubernetes 자체 이벤트와 Zenius 전용 이벤트를 구분해 보다 세부적으로 체계화된 장애 관리 기능을 제공합니다. 각 이벤트에 대해 임계값과 심각도를 운영자 정의할 수 있어, 운영자는 환경에 적합한 기준으로 장애를 감지하고 우선순위를 설정할 수 있습니다. Zenius K8s의 다채널 알림 시스템은 푸시 앱, 이메일, 문자 등 다양한 방식으로 장애 정보를 즉시 전달하여 운영자가 신속하게 대응할 수 있도록 합니다. 단순히 알림을 보내는 것에 그치지 않고, 장애 발생 시점부터 종료 시점까지의 전체 상황을 기록하고 분석할 수 있어, 운영자는 문제 해결뿐만 아니라 유사 상황에 대한 재발 방지 대책을 수립할 수 있습니다. 또한, Zenius K8s는 발생한 장애 이벤트에 대한 상세 로그와 이력 데이터를 제공하여, 운영자가 근본 원인을 신속히 파악할 수 있도록 지원합니다. 이를 기반으로 장애 발생 원인과 영향을 체계적으로 분석하고, 동일한 문제가 재발하지 않도록 최적의 운영 환경을 설계할 수 있습니다. [이벤트 현황관리 화면 예시] [3] 실시간 로그 모니터링 및 분석 운영 환경에서 발생하는 로그는 문제의 원인을 파악하고 성능을 최적화하는 데 중요한 데이터를 제공합니다. Zenius K8s는 컨테이너 기반 애플리케이션의 동작, 오류, 디버깅 로그는 물론, Kubernetes 이벤트 로그(Kubelet, API Server 등)까지 실시간으로 수집하고 분석할 수 있는 기능을 제공합니다. 이 기능은 운영자가 시스템의 전반적인 상태를 심층적으로 모니터링하고, 잠재적 문제를 사전에 발견할 수 있도록 지원합니다. Zenius K8s의 실시간 로그 모니터링은 시점별 데이터 분석 기능을 통해 특정 기간 동안 발생한 로그 데이터를 확인하고, 문제 발생 시점과 원인을 빠르게 추적할 수 있도록 돕습니다. 운영자는 실시간으로 발생하는 로그를 모니터링하며, 필요할 경우 보고서 형태로 데이터를 내보내어 팀 내 공유나 추가 분석에 활용할 수 있습니다. 이 기능은 장애 대응 시간을 단축시키는 동시에, 문제 해결을 위한 협업을 효율적으로 지원합니다. 또한, Zenius K8s의 실시간 로그 분석 기능을 통해 운영자는 현재 발생하고 있는 로그를 실시간으로 확인하여 상황에 따라 빠르게 조치를 취할 수 있습니다. 이 기능은 운영 환경에서 투명성을 강화하고, 예기치 않은 장애로 인한 서비스 중단을 최소화하는 데 중요한 역할을 합니다. [4] 효율적인 리소스 활용 지원 Zenius K8s는 클러스터와 주요 구성 요소(Node, Pod, Container)의 CPU, 메모리, 네트워크 사용량을 실시간으로 추적하여, 자원이 비효율적으로 사용되거나 과부하가 발생할 가능성을 사전에 감지할 수 있는 모니터링 기능을 제공합니다. 운영자는 이를 통해 특정 구성 요소가 리소스를 과도하게 소모하고 있는지 빠르게 확인할 수 있으며, 이를 기반으로 적절한 조치를 취할 수 있습니다. 예를 들어, 특정 Pod가 비정상적인 메모리 사용량을 보일 경우, Zenius K8s는 이를 즉각 감지하여 경고를 제공하고, 운영자가 문제를 해결할 수 있도록 도와줍니다. 이러한 기능은 리소스의 낭비를 줄이고, 시스템의 안정성을 높이는 데 중요한 역할을 합니다. 또한, 쿠버네티스의 자동 확장 기능에 따라 생성되는 파드(Pod)에 대해 Zenius K8s는 자동으로 모니터링을 수행합니다. 이를 통해 새로 생성된 파드의 상태와 리소스 사용량을 실시간으로 추적하여 운영자는 추가적인 설정 없이도 전체 시스템의 상태를 효율적으로 관리할 수 있습니다. Zenius K8s의 특장점 Zenius는 K8s는 위에 살펴본 주요기능에 더해서, 복잡한 쿠버네티스 환경을 더욱 효과적으로 운영하고 관리할 수 있도록 지원할 수 있는 세 가지 특장점을 가지고 있습니다. [1] 확장성 있는 구조를 바탕으로 한 연관 장비 통합 모니터링 Zenius는 K8s 모니터링을 포함하여 SMS, NMS, APM, DBMS등 총 23개의 포인트 솔루션을 연계할 수 있는 Framework으로 구성되어 있습니다. 따라서 운영자는 Kubernetes 클러스터는 물론 컨테이너 오케스트레이션, 서비스 모니터링, 네트워크 관리, 애플리케이션 성능 분석까지 한 시스템에서 일괄적으로 모니터링하고 관리할 수 있습니다. 이러한 확장성은 운영자가 새로운 모니터링 대상을 손쉽게 추가하고, 기존 인프라와 새로운 인프라를 유기적으로 통합하여 대규모 환경에서도 일관된 관리 체계를 유지할 수 있도록 합니다. 예를 들어, Kubernetes 클러스터와 네트워크 장비를 연결해 네트워크 병목 현상이 클러스터 및 애플리케이션 성능에 미치는 영향을 파악할 수 있습니다. 이러한 통합 모니터링은 대규모 환경에서도 일관성을 유지하며, 복잡한 IT 환경에서 발생하는 문제의 근본 원인을 효율적으로 분석할 수 있도록 지원합니다. Zenius K8s는 또한, 서버, 네트워크 장비, 애플리케이션 등 IT 인프라 전반에 대한 성능 데이터를 통합적으로 제공합니다. 이를 통해 특정 장비나 네트워크에서 발생한 성능 저하가 클러스터 및 애플리케이션 운영에 미치는 영향을 직관적으로 파악할 수 있습니다. 이처럼 전체 IT 인프라를 아우르는 통합 모니터링 기능은 운영자에게 단순히 데이터를 제공하는 것을 넘어, 서비스 안정성과 문제 해결의 정확성을 높이는데 기여합니다. [2] APM 연계를 통한 애플리케이션 심층 분석 쿠버네티스는 애플리케이션을 컨테이너화하여 자동화된 배포, 확장, 관리를 가능하게 함으로써 서비스의 안정성과 효율성을 높이는 데 주로 활용됩니다. 따라서 쿠버네티스 모니터링 솔루션은 APM(Application Performance Management)과의 연계가 중요합니다. Zenius K8s는 APM과의 강력한 연계를 통해 Kubernetes 환경 내에서 운영 중인 애플리케이션의 성능을 세밀하게 분석할 수 있도록 지원합니다. 이를 통해 애플리케이션이 처리하는 트랜잭션 속도와 같은 주요 성능 지표는 물론, 지연 발생 구간, 병목 현상 등을 실시간으로 모니터링하고 분석하여 문제의 근본 원인을 신속히 진단할 수 있도록 합니다. 특히, APM 연계를 통해 애플리케이션의 전체 트랜잭션 흐름을 시각화함으로써 개별 트랜잭션에서 발생하는 성능 저하나 지연이 클러스터 성능에 미치는 영향을 파악할 수 있습니다. 예를 들어, 특정 트랜잭션에서 비정상적인 지연이 발생할 경우, APM 솔루션은 이를 실시간으로 탐지하여 해당 구간에 대한 세부적인 성능 데이터를 제공합니다. 이를 통해 트랜잭션 지연의 원인을 파악하고, 최적화 작업을 통해 성능을 개선할 수 있습니다. 또한, Zenius K8s는 트랜잭션 병목 현상의 위치와 원인을 명확히 규명할 수 있는 분석 도구를 포함하고 있어, 특히 마이크로서비스 구조의 복잡한 애플리케이션에서 병목 구간을 체계적으로 최적화할 수 있습니다. 이와 같은 심층적인 성능 분석 기능은 단순히 자원 사용 모니터링을 넘어, 애플리케이션 내부에서 발생하는 성능 이슈를 구체적으로 진단하는 데 중점을 둡니다. [3] 메타정보와 변경 이력 관리의 편의성 Zenius K8s는 Kubernetes 오브젝트에 대한 상세한 메타정보를 명령어 입력 없이 직관적으로 조회할 수 있는 고급 메타정보 뷰어를 제공합니다. 운영자는 각 오브젝트의 이름, 라벨(Label), 주석(Annotation) 등 주요 메타정보를 빠르게 확인할 수 있어 오브젝트 상태를 명확히 이해할 수 있습니다. 이 기능은 클러스터의 모든 오브젝트에 대해 체계적인 정보를 제공하며, 특히 동적이고 복잡한 Kubernetes 환경에서 유용하게 활용됩니다. [K8s 구성 요소 별 메타 정보 조회 화면 예시] 또한, Zenius K8s는 구성 변경 이력 관리 기능을 포함하여 이전에 수행된 구성 변경 사항을 시각적으로 한눈에 확인할 수 있도록 지원합니다. 예를 들어, 운영자는 특정 시점에서 이루어진 설정 변경이 클러스터 성능에 미친 영향을 파악하거나, 문제 발생 시 원인을 추적하여 신속히 복구할 수 있습니다. 이를 통해 변경 이력 내역을 단계별로 조회할 수 있습니다. Zenius K8s의 메타정보 및 변경 이력 관리 기능은 구성 변경이 빈번하게 발생하는 대규모 Kubernetes 환경에서 특히 중요한 역할을 합니다. 구성 요소가 많고 자주 변경되는 환경에서는 변화에 따른 혼선이 발생하기 쉬운데, 이 기능은 구성 내역의 투명성을 제공하고, 불필요한 문제를 예방하며, 신속한 문제 해결을 가능하게 합니다. 운영자는 변경 이력을 기반으로 각 오브젝트의 최신 상태와 과거 설정 내역을 체계적으로 관리하여 안정적인 운영을 유지할 수 있습니다. [메타 정보 이력 추적 및 변경 사항 조회 화면 예시] Zenius K8s는 멀티 클러스터 관리, 실시간 모니터링, 장애 탐지 및 대응, 자원 활용 최적화 등 Kubernetes 운영에서 필수적인 기능을 제공합니다. 특히, Framework 기반 구조를 통해 SMS, NMS, APM, DBMS와 같은 다양한 포인트 솔루션과 연계가 가능하여, 컨테이너 오케스트레이션부터 네트워크 관리, 애플리케이션 성능 분석까지 포괄적인 모니터링과 관리를 지원합니다. 특히, APM 연계 기능은 애플리케이션의 트랜잭션 속도, 병목 현상, 지연 발생 구간 등 주요 성능 지표를 실시간으로 모니터링하고 분석할 수 있도록 하여, 문제의 근본 원인을 빠르게 진단하고 최적화할 수 있도록 돕습니다. 연관 장비 모니터링 기능은 서버, 네트워크 장비 등 IT 인프라 전반의 상태를 통합적으로 분석하여, 각 요소가 Kubernetes 클러스터와 애플리케이션 성능에 미치는 영향을 정확히 파악할 수 있도록 지원합니다. Zenius K8s는 이러한 기능들을 통해 운영자가 복잡한 IT 환경에서도 안정적이고 효율적인 관리 체계를 구축할 수 있도록 도와주는 유용한 솔루션입니다.
2024.11.21
웹 애플리케이션 모니터링 솔루션, Zenius APM의 주요기능과 특장점
웹 애플리케이션 모니터링 솔루션, Zenius APM의 주요기능과 특장점
웹 애플리케이션은 이제 단순한 서비스 제공 도구를 넘어 기업의 경쟁력을 좌우하는 중요한 요소로 자리 잡았습니다. 웹 애플리케이션의 성능은 사용자 경험의 품질을 결정짓는 중요한 요소이기 때문에, 매출 증가와 브랜드 신뢰도 형성에 직접적인 영향을 미칩니다. 그러나 트랜잭션 처리량이 급격히 증가하고, 데이터의 양과 복잡성이 더해지면서, 웹 애플리케이션의 안정적이고 효율적인 운영을 위해 실시간 모니터링과 정교한 성능 관리가 반드시 필요합니다. Zenius APM은 이러한 복잡한 요구를 충족시킬 수 있는 솔루션으로, 웹 애플리케이션의 성능 최적화와 운영 안정성 강화를 위한 다양한 기능을 제공합니다. 특히, 실시간 모니터링, 심층 분석, 장애 관리와 같은 핵심 역량을 기반으로 IT 환경의 복잡성을 효과적으로 관리하고 운영 효율성을 높일 수 있도록 돕습니다. Zenius APM이 제공하는 주요 기능과 특장점을 자세히 살펴보겠습니다. Zenius APM의 주요기능 [1] 효과적인 실시간 모니터링 Zenius APM은 웹 애플리케이션의 성능을 실시간으로 모니터링하여 운영자가 시스템 상태를 시각적으로 파악하고, 잠재적 문제를 조기에 발견해 신속히 대응할 수 있도록 지원합니다. 우선 Zenius APM의 대시보드는 사용자별로 맞춤 설정이 가능합니다. WYSIWYG 방식을 채택하여 운영자가 원하는 모니터링 항목을 직관적으로 구성할 수 있습니다. 운영자는 드래그 앤 드롭으로 모니터링 항목을 배치하고, 데이터 포인트를 중심으로 상황판을 제작해 각자의 운영 환경에 최적화된 대시보드를 손쉽게 구축할 수 있습니다. Real-Time Topology Map은 트랜잭션의 흐름과 병목 구간을 시각적으로 보여주는 기능입니다. 응답 시간과 처리량을 색상과 노드로 표시하며, 문제 발생 지점을 직관적으로 파악할 수 있도록 설계되었습니다. 병목 구간이나 성능 저하가 발견될 경우, 해당 노드를 클릭하여 상세한 분석 화면으로 즉각 이동할 수 있어 문제를 신속히 해결할 수 있습니다. Zenius APM이 제공하는 주요 모니터링 항목으로는 트랜잭션 응답 시간과 병목 구간, JVM 힙 메모리와 CPU 사용량, JDBC 연결 상태와 SQL 실행 건수, 동시 접속 사용자 수와 TPS(초당 트랜잭션 처리량) 등이 있습니다. 이러한 지표를 통해 운영자는 성능 최적화와 안정성을 효과적으로 관리할 수 있습니다. [2] 장애 관리 지원 Zenius APM은 웹 애플리케이션의 안정적인 운영을 위해 장애를 사전에 방지하고, 발생한 장애를 신속하고 정확하게 분석할 수 있는 기능을 제공합니다. 우선, 장애 정책 기반 이벤트 감지 기능을 통해 서비스 처리량(TPS), 응답 시간, JVM 자원 사용률 등 주요 성능 지표에 임계치를 설정할 수 있습니다. 임계치가 초과되면 SMS, 이메일, Push App 등을 통해 실시간 경고를 전송하여 운영자가 즉각적으로 대응할 수 있도록 지원합니다. 또한, Snapshot 분석 기능은 장애가 발생한 시점의 성능 데이터를 Raw 데이터 기반으로 재현하여 문제를 정밀하게 분석할 수 있도록 도와줍니다. 이를 통해 장애의 정확한 원인을 파악하고, 향후 동일한 문제가 발생하지 않도록 사전에 대비할 수 있습니다. 이와 더불어, 통합 이벤트 관리 기능은 발생한 이벤트 이력을 체계적으로 기록하고 관리합니다. 이를 통해 장애 처리 과정을 명확히 추적할 수 있으며, 과거 데이터를 기반으로 유사한 상황이 발생했을 때 신속하고 효과적인 대처가 가능합니다. 이벤트 관리 시스템은 처리 상태, 발생 시간, 지속 시간, 장애 유형 등의 세부 정보를 저장하며, 운영자는 이를 활용하여 문제 해결 프로세스를 최적화할 수 있습니다. [3] 다양한 성능 분석 지원 Zenius APM은 다양한 성능 분석 도구를 통해 운영자가 애플리케이션 성능 데이터를 심층적으로 이해하고, 데이터 기반의 최적화된 결정을 내릴 수 있도록 지원합니다. 주제별 성능 분석은 애플리케이션 및 데이터베이스 성능을 심층적으로 이해하고 개선하는 데 중요한 역할을 합니다. 애플리케이션 분석은 호출 건수, 실패 건수, 응답 시간 등을 통해 애플리케이션 상태를 종합적으로 파악할 수 있도록 돕습니다. 반면, SQL 분석은 데이터베이스 쿼리 호출 빈도, 평균 응답 시간, 실패 건수 등 세부 데이터를 제공하여 비효율적인 SQL 쿼리를 식별하고 데이터베이스 성능을 최적화할 수 있도록 지원합니다. 또한, 품질 이슈 분석은 Exception과 Error 발생 원인을 트랜잭션 데이터와 연관시켜 문제를 효과적으로 해결할 수 있도록 돕습니다. 특히, 자동 연관 분석은 SQL, 애플리케이션, 트랜잭션 데이터를 연결하여 성능 문제의 원인과 연관성을 시각적으로 표현합니다. 이를 통해 복잡한 데이터를 직관적으로 이해하고, 문제 해결에 필요한 핵심 정보를 빠르게 파악할 수 있습니다. 마지막으로, 기간별 증감 추이 비교 기능은 특정 기간 동안의 호출 건수, 응답 시간 등의 데이터를 비교하여 성능 변화 추이를 명확히 파악할 수 있습니다. 이를 기반으로 성능 저하의 원인을 식별하고, 구체적인 시스템 개선 방향을 도출할 수 있습니다. [4] 사용자 맞춤형 통계 및 보고서 Zenius APM은 사용자 맞춤형 데이터 시각화와 보고서 생성을 통해 운영자가 필요한 정보를 효율적으로 제공하며, 데이터 기반 의사결정을 지원합니다. 통계 템플릿 기능은 Zenius APM이 제공하는 대표적인 사용자 편의 도구 중 하나로, 방문자 수, 시스템 자원 사용률, 트랜잭션 처리 건수 등 35개 이상의 주요 성능 지표를 기반으로 템플릿을 저장하고 재활용할 수 있습니다. 이를 통해 운영자는 빈번히 사용하는 보고서 양식을 템플릿화함으로써 반복적인 작업 시간을 줄이고, 데이터 분석과 의사결정에 더 많은 시간을 할애할 수 있습니다. 또한, 다양한 유형의 보고서를 생성할 수 있는 기능은 Zenius APM의 또 다른 강점입니다. 성능 비교, 이벤트 발생 현황 분석, 자원 증설 필요성 평가 등 다양한 보고서를 통해 운영 상황을 종합적으로 분석하고, 개선 방안을 도출할 수 있습니다. 이러한 맞춤형 통계와 보고서는 운영자에게 명확하고 유용한 인사이트를 제공하여, 효율적이고 전략적인 시스템 운영을 가능하게 합니다. 이러한 맞춤형 통계와 보고서는 단순한 데이터 시각화 도구를 넘어, 운영자가 운영 상태를 명확히 이해하고 전략적인 결정을 내릴 수 있도록 지원하는 중요한 역할을 합니다. Zenius APM의 특장점 지능형 IT 인프라 통합 관리 솔루션인 Zenius의 핵심 구성 요소인 Zenius APM은 다양한 IT 자원의 연관성을 체계적으로 분석하며, 효율적이고 신뢰할 수 있는 모니터링 환경을 제공합니다. EMS Framework를 기반으로 구축된 Zenius APM은 웹 애플리케이션과 서버, 네트워크 등 다양한 인프라를 중앙에서 집중적으로 모니터링할 수 있는 기능을 지원합니다. 또한, 하드웨어와 미들웨어를 포함한 이기종 인프라를 통합 관리하기 위한 도구를 제공하며, Overview와 Service Map을 통해 시스템 전반의 상호작용을 명확히 파악할 수 있습니다. 특히, 서버와 DBMS를 비롯한 IT 인프라 전반의 상호작용을 분석하여 장애의 원인과 영향을 신속히 파악하고, 이를 바탕으로 심층적이고 효율적인 관리를 지원합니다. 이러한 기능을 통해 운영자는 문제를 조기에 발견하고 신속히 해결할 수 있으며, 안정적이고 효율적인 IT 환경을 유지할 수 있습니다. 또한 최근 많이 활용되는 쿠버네티스 모니터링 솔루션(Zenius K8s)과의 연계를 통해 컨테이너 기반의 마이크로서비스 아키텍처 및 분산 환경에서도 뛰어난 관리 성능을 발휘합니다. 쿠버네티스 클러스터의 POD와 컨테이너 상태를 실시간으로 모니터링하며, 자동 스케일링과 같은 클라우드 네이티브 기능을 통해 변화가 잦은 환경에서도 안정적인 서비스 운영을 보장합니다. 또한 Zenius APM은 장애가 발생한 특정 시점(예: 예외 발생 또는 오류 시점)의 애플리케이션 성능 정보를 정밀하게 재현할 수 있습니다. Raw 데이터 기반의 스냅샷 분석을 활용하여 과거의 실시간 운영 상태를 정확히 복원하며, 이를 통해 문제의 원인을 신속하고 정밀하게 파악할 수 있습니다. 사용자가 필요에 따라 분석 항목과 화면 구성을 선택적으로 조정할 수 있어, 상황에 맞춘 유연하고 효율적인 분석이 가능합니다. Zenius APM은 세분화된 장애 심각도 설정과 SMS, 이메일, Push 알림 등 다양한 방식으로 장애 발생을 빠르게 알립니다. 또한, 에스컬레이션 통보 기능을 통해 운영자는 중요한 장애가 누락되지 않도록 관리하며 대응 시간을 단축할 수 있습니다. 이와 더불어, 애플리케이션과 인스턴스를 논리적으로 그룹화하여 비즈니스 관점에서 실시간 서비스 성능을 모니터링할 수 있도록 지원합니다. 이를 통해 인스턴스 관점과 비즈니스 관점의 실시간 듀얼(Dual) 모니터링 환경을 제공하며, 실제 서비스와 연계된 성능 관리를 더욱 효과적으로 수행할 수 있습니다. Zenius APM은 복잡한 IT 환경에서 웹 애플리케이션의 성능을 최적화하고 운영 안정성을 보장하는 데 필요한 모든 기능을 제공합니다. 실시간 모니터링, 장애 관리, 성능 분석, 그리고 사용자 맞춤형 보고서 기능은 운영자가 문제를 사전에 예방하고 효율적으로 대처할 수 있는 기반을 마련합니다. 이를 통해 기업은 안정적이고 효율적인 IT 운영을 실현하며 비즈니스 경쟁력을 강화할 수 있습니다.
2024.11.29
네트워크 모니터링 솔루션, Zenius NMS 자세히 보기
네트워크 모니터링 솔루션, Zenius NMS 자세히 보기
최근 네트워크 환경은 클라우드 기술의 발전과 활용 확대, IoT 디바이스의 증가, 그리고 5G와 같은 고속 네트워크 기술의 발전으로 인해 더욱 복잡해지고 있습니다. 이러한 변화로 인해 단순히 네트워크 이상 유무를 확인하는 수준을 넘어, 실시간 통합 모니터링, 장애 관리, 트래픽 분석, 보안 위협 탐지 및 대응과 같은 고도화된 기능을 제공하는 네트워크 모니터링 솔루션의 중요성이 더욱 부각되고 있습니다. 이러한 상황에서 Zenius NMS는 네트워크 전체를 통합적으로 관리할 수 있는 솔루션으로, 고도화된 실시간 모니터링과 장애 예측 분석 기능을 제공하며 많은 기관과 기업에서 활용되고 있습니다. Zenius NMS의 주요 특징과 장점은 무엇인지 지금부터 자세히 알아보겠습니다. 네트워크 모니터링 솔루션, Zenius NMS의 주요기능 [1] 직관적인 통합 모니터링 Zenius NMS는 네트워크 상태를 한눈에 파악할 수 있도록 설계된 통합 모니터링 시스템과 시각화 도구를 제공합니다. Topology Map 기능은 네트워크 연결 상태를 직관적으로 가시화하여 전체 네트워크 구조와 상태를 한눈에 파악할 수 있도록 돕습니다. 장애 및 트래픽 상태를 색상과 점멸 효과로 표시해 문제 발생 지점을 신속히 파악할 수 있도록 지원합니다. 또한, 다수의 Topology Map을 멀티 슬라이드 쇼로 관리할 수 있는 기능을 통해 다양한 네트워크 환경에서 실시간 상태를 직관적으로 모니터링하고, 복잡한 연결 관계를 효율적으로 파악할 수 있습니다. Auto Map은 네트워크 연결 상태를 자동으로 분석하고 장비 간 연관 관계를 즉시 시각화하여 관리 작업의 자동화와 운영 효율성을 높입니다. 이와 함께, 관심 인터페이스 그룹 모니터링 기능은 설정된 주요 인터페이스 그룹의 성능 추이를 비교 분석하여 특정 네트워크 구간에 대한 집중 모니터링을 지원합니다. 마지막으로, 통합 대시보드는 주요 성능 지표와 네트워크 상태를 하나의 화면에서 제공하며, 일/주/월 단위 성능 추이 그래프로 장기적인 네트워크 상태를 분석할 수 있도록 지원합니다. 이러한 다양한 기능들은 운영자가 신속하고 정확한 의사결정을 내릴 수 있도록 뒷받침합니다. [2] 실시간 장애 관리와 예방 지원 Zenius NMS는 장애를 사전에 예방하고, 발생 시 신속히 대응할 수 있는 실시간 장애 관리 기능을 제공합니다. 과거 성능 데이터를 분석하여 동적 임계치를 설정함으로써 장애 발생 가능성을 사전에 파악하고 선제적인 조치를 가능하게 합니다. 장애 발생 시 Root Cause 분석을 활용해 주요 원인을 빠르게 식별하고 해결책을 제시하며, 네트워크 장비 간 관계를 분석하여 비효율적인 이벤트를 필터링함으로써 문제 분석의 정확성과 속도를 높입니다. 또한, 장애 처리 이력을 관리하여 조치 내역과 관련 파일을 기록하고, 이를 Knowledge DB로 활용해 유사 장애에 신속히 대응할 수 있습니다. SMS, Email, Push 알림 등 다양한 경로를 통해 장애 정보를 전달하여 즉각적인 대응을 지원합니다. 이러한 통합적인 장애 관리 기능을 통해 Zenius NMS는 서비스 중단 시간을 최소화하며 네트워크 운영의 안정성과 신뢰성을 강화합니다. [3] 주요 항목에 대한 실시간 모니터링 Zenius NMS는 네트워크 성능 데이터를 실시간으로 수집하고 분석하며, 구성 변경 사항을 체계적으로 관리하여 안정적인 운영 환경을 제공합니다. 이를 통해 초 단위로 bps, pps, CPU/MEM 사용률 등 주요 성능 지표를 수집하여 네트워크 상태를 실시간으로 모니터링할 수 있습니다. 또한, L4 장비의 Virtual/Real Server 세션 정보와 라우팅 테이블 상태를 모니터링하고, 인터페이스 연결 정보(IP/MAC 등)를 제공함으로써 네트워크 병목 현상을 사전 식별하여 대응할 수 있습니다. SNMP 방식으로 수집되지 않는 항목은 CLI 명령어와 스크립트를 활용해 사용자 정의 항목으로 등록 및 관리할 수 있습니다. Configuration 백업 및 변경 관리 기능을 통해 설정 변경 시 자동 백업과 변경 내역 비교가 가능하여 구성의 신뢰성과 변경 관리의 체계성을 강화합니다. 이러한 기능들은 네트워크 성능을 최적화하고, 병목 현상이나 구성 오류를 사전에 예방함으로써 운영의 안정성을 높여줍니다. [4] 네트워크 보안 및 접근 관리 Zenius NMS는 네트워크 보안을 강화하기 위해 다양한 기능을 제공합니다. 행정안전부 권고사항(국가 표준 기준)을 기반으로 보안 취약점을 자동 점검하고, 점검 결과에 따라 구체적인 보안 조치 가이드를 제공하여 네트워크 보안성을 강화합니다. 비인가 명령어 실행 차단, 허용된 IP와 시간대 설정을 지원하는 금지 명령어 통제 및 세션 접속 시간 관리 기능을 통해 네트워크 보안을 한층 더 강화합니다. 또한, 네트워크 장비 접근 기록을 저장하고 조회하며, 작업 내역을 녹화/재생할 수 있는 접근 이력 감사 기능은 철저한 보안 관리와 감사를 가능하게 합니다. 더불어서, 특정 IP에서만 장비 접근을 허용하는 IP 기반 접근 제한 기능을 통해 네트워크 무결성을 유지하고 외부 위협으로부터 네트워크를 보호합니다. 이러한 통합적인 보안 관리 기능은 네트워크 운영의 안정성을 높이고 무결성을 유지시켜 줍니다. 네트워크 모니터링 솔루션, Zenius NMS만의 장점 IT 인프라를 효과적으로 관리하려면 네트워크를 포함한 모든 구성 요소를 통합적으로 관리하는 것이 중요합니다. 이는 데이터 흐름, 리소스 배분, 애플리케이션 성능이 IT 인프라 구성 요소 간의 상호작용과 연결성에 크게 의존하기 때문입니다. 특히, 클라우드, 가상화(VM), 쿠버네티스와 같은 기술의 빠른 확산으로 IT 환경은 더욱 복잡해지고, 구성 요소 간 상호 연관성은 강화되고 있습니다. 따라서 이러한 복잡성을 제대로 관리하지 못하면 서비스 품질이 저하되고 운영 비용이 증가할 수밖에 없습니다. 이러한 상황에서 Zenius NMS는 프레임워크 기반 구조를 통해 네트워크 모니터링을 넘어 IT 인프라 전반의 구성 요소를 통합해서 관리할 수 있는 솔루션을 제공합니다. Zenius NMS는 온프레미스뿐 아니라 클라우드, VM, 컨테이너 기반 환경에 대한 모니터링을 지원합니다. 또한 네트워크와 연관된 서버, 애플리케이션, 데이터베이스 등을 실시간으로 통합해서 모니터링할 수 있습니다. 이를 통해 운영자는 네트워크 병목 현상, 비효율적인 자원 활용, 그리고 성능 저하와 같은 문제를 사전에 감지하고 예방할 수 있습니다. 특히, 장애 가능성을 조기에 파악함으로써 서비스 중단 위험을 줄이고, 안정적인 운영이 가능합니다. 장애가 발생하더라도 실시간 원인 분석 및 대응 프로세스를 통해 복구 시간을 최소화할 수 있으며, 인프라 운영 전반에 대한 종합적인 가시성을 제공하여 신속하고 정확한 의사결정을 지원합니다. 이를 통해 복잡한 IT 환경에서도 운영 효율성을 높이고 서비스 안정성을 유지할 수 있습니다. 네트워크 모니터링 솔루션, Zenius NMS 자세히 보기 이와 함께 Zenius NMS는 네트워크 모니터링에 특화된 다양한 장점을 제공합니다. 특히, 사용자의 상황과 필요에 따라 설정을 조정할 수 있는 Topology Map과 대시보드 기능은 네트워크 구성 요소의 상태와 연결 관계를 직관적으로 시각화하여 장애 발생 시 신속한 원인 분석과 대응을 지원합니다. 또한, 실시간 이벤트 필터링과 멀티 슬라이드 쇼 기능을 통해 대규모 네트워크 환경에서도 주요 성능 지표와 장애 상황을 효율적으로 모니터링할 수 있어 운영 효율성을 극대화합니다. Zenius NMS의 운영 요약 View는 주요 네트워크 성능과 상태를 종합적으로 제공하며, 엑셀 Export 기능을 통해 체계적이고 신속한 데이터 분석 및 보고를 지원합니다. 그리고 SDN(소프트웨어 정의 네트워크) 모니터링 기능을 통해 네트워크 장비별 상세 성능 데이터를 심층적으로 분석하고, 연결 관계 및 장애 상태를 정밀하게 파악할 수 있도록 지원합니다. Zenius NMS는 클라우드, 가상화, 컨테이너 환경 등 복잡한 IT 인프라를 통합적으로 관리할 수 있는 네트워크 모니터링 솔루션입니다. Topology Map, SDN 모니터링, 보안 취약점 점검 등 고도화된 기능을 통해 네트워크의 복잡성을 효과적으로 관리하며 안정적이고 효율적인 운영을 지원합니다. 다양한 산업군에서의 성공적인 활용 사례를 통해 신뢰성을 입증한 Zenius NMS는 복잡한 IT 환경에서도 믿을 수 있는 솔루션입니다.
2024.12.24
IT 인프라 모니터링 트렌드
IT 인프라 모니터링 트렌드
EMS란? EMS는 Enterprise Management System의 약자로, 여러 기업과 기관의 IT서비스를 이루는 다양한 IT Infrastructure를 통합적으로 모니터링하는 시스템을 의미합니다. 해외에서는 일반적으로 ITIM(IT Infra Management)이라는 용어로 많이 사용되고 있지만, 국내에서는 EMS라는 용어로 통용되고 있습니다. EMS는 IT인프라의 데이터를 실시간으로 수집 및 분석할 뿐만 아니라, 수집된 데이터를 활용해 비즈니스의 가치를 창출할 수 있습니다. 글로벌 IT분야 연구자문 기업인 “가트너(Gartner)”에서는 ITIM, 즉 EMS를 데이터센터, Edge, IaaS(Infrastructure as a Service), PaaS(Platform as a Service) 등에 존재하는 IT인프라 구성요소의 상태와 리소스 사용률을 수집하는 도구로 정의하며, 컨테이너, 가상화시스템, 서버, 스토리지, 데이터베이스, 라우터, 네트워크 스위치 등에 대한 실시간 모니터링이 가능해야 한다고 서술합니다. <사진 설명: 가트너의 ITIM 정의를 도식화한 그림> 이러한 EMS는 초기에는 기업 전산실에 물리적인 형태로 존재하는 서버, 네트워크의 리소스관리를 중심으로 모니터링해 왔습니다. 서버의 CPU, Memory 등의 리소스 정보를 수집하거나, 네트워크 장비의 트래픽 정보를 모니터링하고 임계치를 기반으로 이벤트 감지하는 역할이 대부분이었으며, 이 정도 수준에서도 충분한 IT 인프라 관리가 이뤄질 수 있었습니다. 그러나 가상화(Virtualization)라는 개념이 생겨나고 다양한 IT 인프라들이 기업 전산실에서 클라우드(Cloud) 환경으로 전환됨에 따라, EMS의 모니터링 분야도 조금씩 바뀌어 가고 있습니다. 많은 기업들이 효율적인 리소스 사용과 비용 절감을 목표로 VMware와 같은 가상화 시스템을 도입해 운영하게 됐으며, 모니터링 부문도 이에 대응하기 위해 가상화 리소스에 대한 관리 영역으로 확장됐습니다. 가상화 환경을 이루는 하이퍼바이저(Hypervisor)와 가상머신(Virtual Machine)의 연관성을 추적하고, 각 가상머신들이 사용하고 있는 리소스를 실시간으로 분석해 효율적인 자원 배분, 즉 프로비저닝(Provisioning)을 위한 근거 데이터를 제공할 수 있도록 하고 있습니다. 더 나아가 VMware, Hyper-V 등의 다양한 가상화 플랫폼에서 가상머신을 생성하고 삭제하고, 실제로 가상머신에 CPU, Memory 등과 같은 리소스를 할당해 줄 수 있는 컨트롤 영역까지 제공하는 제품을 개발하는 벤더사들이 많아지고 있습니다. 이러한 가상화 기술을 기반으로 현대에는 IT 인프라들이 대부분 클라우드 환경으로 전환하고 있는 추세입니다. 클라우드 환경으로의 전환 클라우드(Cloud)란, 언제 어디서나 필요한 컴퓨팅 자원을 필요한 시간만큼 인터넷을 통해 활용할 수 있는 컴퓨팅 방식으로, 최근 기업들은 각자의 목적과 상황에 맞게 AWS, MS Azure와 같은 Public Cloud 및 OpenStack, Nutanix 등을 활용한 Private Cloud 등의 환경으로 기업의 전산설비들을 마이그레이션 하고 있습니다. 클라우드로의 전환과 기술의 발전에 따라, EMS의 IT 인프라 모니터링은 더 이상 *On-Premise 환경에서의 접근이 아닌, Cloud 환경, 특히 MSA(Micro Service Architecture)를 기반으로 하는 클라우드 네이티브(Cloud Native) 관점에서의 IT 운영 관리라는 새로운 접근이 필요하게 됐습니다. (*On-Premise : 기업이 서버를 클라우드 환경이 아닌 자체 설비로 보유하고 운영하는 형태) 클라우드 네이티브란, 클라우드 기반 구성요소를 클라우드 환경에 최적화된 방식으로 조립하기 위한 아키텍처로서, 마이크로서비스 기반의 개발환경, 그리고 컨테이너 중심의 애플리케이션 구동환경 위주의 클라우드를 의미합니다. 클라우드 네이티브는 IT비즈니스의 신속성을 위해 도커(Docker)와 같은 컨테이너를 기반으로 애플리케이션이 운영되므로, EMS는 컨테이너의 성능, 로그, 프로세스 및 파일시스템 등 세부적인 관찰과 이상징후를 판단할 수 있는 기능들이 요구되고 있습니다. 자사 제품인 Zenius SMS에서는 이러한 변화에 따라 Docker에 대한 모니터링 기능을 기본적으로 제공하고 있습니다. Docker 컨테이너가 생성되면 자동으로 관리대상으로 등록되며, Up/Down 뿐만 아니라, CPU, Memory, Network 및 Process의 정보를 실시간으로 모니터링하고 발생되는 로그들을 통합관리 할 수 있도록 합니다. <사진 설명: Zenius-SMS에서 제공하고 있는 Docker 컨테이너 모니터링 기능> 또, 복원력과 탄력성을 위해 쿠버네티스와 같은 오케스트레이션 도구를 활용해 컨테이너를 스핀업하고, 예상되는 성능에 맞게 효율적으로 리소스를 맵핑하고 있으며, 이러한 기술에 대응하기 위해 EMS는 쿠버네티스(Kubernetes), 도커스웜(Docker Swarm) 등의 오케스트레이터들의 동작여부를 직관적으로 관찰하는 제품들이 지속적으로 출시되고 있는 상황입니다. 이와 더불어 컨테이너, 오케스트레이터의 동적 연결관계를 실시간으로 모니터링하고, 파드(POD), 클러스터, 호스트 및 애플리케이션의 관계를 표현하는 역할의 중요성이 점차 커져가고 있습니다. 통합 모니터링(Monitoring) EMS 모니터링의 또 다른 변화로는 통합(Integration)의 역할이 더더욱 강해지고 있다는 것입니다. IT 서비스가 복잡해지고 다양해짐에 따라 IT 인프라의 관리 범위도 점차 증가하면서, 다양한 IT 인프라들을 융합하고 관리하기 위한 노력들이 관찰되고 있습니다. 데이터독(Datadog), 스플렁크(SPLUNK)와 같은 장비 관점의 모니터링 벤더들은 APM과 같은 애플리케이션 모니터링 시장으로, 앱다이나믹스(AppDynamics), 다이나트레이스(Dynatrace), 뉴렐릭(NewRelic)과 같은 애플리케이션 모니터링 시장의 강자들은 인프라 장비 관점의 모니터링 시장으로의 융합이 확인되고 있습니다. 자사 제품인 Zenius 역시 서버, 네트워크 중심의 관리에서 애플리케이션, 데이터베이스 등의 시장으로 관리 범위를 확장해 나가고 있는 추세입니다. IT 서비스의 영속성을 유지하기 위해서는 IT 서비스를 구성하는 다양한 요소들을 실시간으로 모니터링하고 연관관계를 추적해 문제 원인을 찾아내는 것이 중요하기 때문에 다양한 IT 요소들을 통합적으로 모니터링하는 것 뿐만 아니라, 상호 연관관계를 표현하고 추적할 수 있는 기능들이 지속적으로 요구되고 있습니다. 모니터링의 트렌드는 서버, 네트워크 등의 독립적인 개체에 대한 모니터링 아닌 IT 서비스를 중심으로 기반 요소들을 모두 통합적으로 모니터링하고, 각 상호간의 의존성과 영향도를 파악해 RCA(Root Cause Analysis) 분석을 가능하게 하고 이를 통해 IT 서비스의 연속성을 보장할 수 있는 통찰력을 확보하게끔 하는 방향으로 흘러가고 있습니다. Zenius는 서버, 네트워크, 애플리케이션, 데이터베이스 및 각종 로그들의 정보를 시각적으로 통합 모니터링할 수 있는 오버뷰(Overview) 도구와 IT 서비스 레벨에서 인프라들의 연관관계를 정의하고 다양한 조건(Rule)에 따라 서비스 이상유무와 원인분석이 가능한 서비스 맵(Service Map) 도구를 기본적으로 제공하고 있습니다. <사진 설명: Zenius 오버뷰 화면> <사진 설명: Zenius 서비스맵 화면> 앞서 언급했듯이, 클라우드 환경으로 전환함에 따라 통합적 관리 요구는 더욱 높아지고 있습니다. IT 인프라에 대한 통합 뿐만 아니라, AD(Active Directory), SAP 및 AWS, Azure, GCP 등의 다양한 서비스의 주요 지표까지 연계하고 하나의 시스템으로 통합 모니터링하기 위한 노력들이 관찰되고 있습니다. 데이터독(Datadog)의 경우, 500개 이상의 시스템, 애플리케이션 및 서비스들의 지표들을 손쉽게 통합 관리할 수 있다고 돼있습니다. <사진 설명: 데이터독 홈페이지 캡처> 이처럼 IT 서비스의 복잡성과 다양화에 따라 관리해야 될 서비스와 지표들은 점점 늘어나고 있으며, 기업의 현황에 맞게 컴포넌트 기반으로 손쉽게 지표들을 통합할 수 있는 기능과 도구들이 요구되고 있습니다. AI 기반의 예측&자동화 모니터링의 세번째 변화로는 ’AI 기반의 예측과 자동화’입니다. IT 인프라 및 서비스의 주요 지표를 모니터링하는 것도 중요하지만, 축적된 데이터를 기반으로 미래의 상황을 예측 및 이상탐지해 사전에 대비할 수 있는 체계를 갖추는 일은 모니터링 시장에서 중요한 이슈로 자리잡고 있습니다. 현재의 AIOps(AI for IT Operations)를 표방하는 모니터링 기술들은 서버, 네트워크, 애플리케이션, 데이터베이스 등의 주요 지표들을 실시간으로 수집하고, 저장된 데이터를 기반으로 AI 알고리즘 또는 통계기법을 통해 미래데이터를 예측하며 장애 발생가능성을 제공하고 있습니다. 이와 같은 기술을 통해 미래 성능 값을 예측해 IT 인프라의 증설 필요성 등을 판단하고, 장애 예측으로 크리티컬한 문제가 발생되기 전에 미리 조치를 취할 수 있도록 해 효율적인 의사결정을 할 수 있도록 합니다. Zenius도 4차 산업혁명 및 디지털 뉴딜시대가 도래함에 따라 미래예측 기능을 최신 버전에 탑재했으며, 이를 통해 IT운영자가 미래 상황에 유연하고 선제적으로 대응할 수 있도록 합니다. Zenius에서는 서버, 네트워크, 애플리케이션 등 다양한 IT 인프라의 미래 성능 값, 패턴 범위, 이상 범위 등을 예측해 IT 운영자에게 제시합니다. <사진 설명: 인공지능(AI) 기반 미래데이터 예측 화면> 다만, 인공지능 기술을 통해 장애 발생 가능성을 탐지하는 기능 외에, 어디에 문제가 발생됐는지 알려주는 기능은 모니터링 시장에 과제로 남아있고, 이를 제공하기 위한 여러 업체들의 노력이 보이고 있습니다. 이제는 EMS에서 보편적인 것이 됐지만, 모바일 기기를 통해 시∙공간적 제약 없는 모니터링이 이뤄지고 있습니다. 다양한 기종의 스마트폰, 태블릿PC 등을 이용해 운영콘솔(Console) 뿐만 아니라, 회의 등 시간을 잠시 비우더라도 IT 인프라에 대한 연속적인 모니터링이 모바일기기를 통해 가능해졌습니다. <사진 설명: 다양한 기기를 통한 모니터링>
2022.09.05
다음 슬라이드 보기