[운영일지] 와탭 시스템으로 운영하기 – Process monitoring

저희 와탭 에서는 자사 제품(SMS, APM)을 이용해서 자체적으로 모니터링을 하며 서비스를 운영하고 있습니다.

서버 모니터링 서비스의 무료 버전은 데이터 저장이 하루밖에 되지 않아, 유료인 Pro 상품을 구매하여 데이터 저장 기간을 1년으로 한 후 모니터링을 하고 있습니다. (당연히 회사의 내부구매로 돈은 지불하지 않습니다. 관리팀 몰래 사용중)

얼마 전 Web 서버에서 알림이 발생해 와탭의 Dashboard 와  Process  모니터링을 통해 문제를 사전에 예방할 수 있었습니다. 당시 상황을 회상하며 어떻게 문제원인을 찾을 수 있었는지 일기 형식으로 나열을 해보려고 합니다. 당시에 사진을 찍을 수 있는 부분들은 사진을 찍었고,  못찍은 부분들은 본 내용을 작성하면서 캡쳐한 부분들입니다.

일기 형식이다 보니 1인칭 시점에서 나열한점 참고하시기 바랍니다.

오전 8시 40분, 사무실 도착

문을 열고 사무실에 들어섰다. 바쁘게 출근한 후 창밖을 바라보며 잠시 맘을 달래본다. 내 자리 오른쪽은 선정릉이 보인다. 항상 점심에 산책을 하려고는 하지만 마음이 급해서 그런지 잘 되지는 않는다.

출근후 마음이 안정되고 정면을 바라본다.

저 Dashboard는 이번에 사무실을 옮기며 마련한 TV 다.

모니터링을 제대로 하려면 상황판이 있어야 한다는 주장을 세워서 관리팀에 강력히 요청해 4대의 TV를 획득했다. 그래서 그런지 Dashboard를 보면 뿌듯하다. 설치 한 건 정말 잘 한 것 같다.

과거를 회상하며 커피를 마시기 위해 바(Bar)로 이동한다.

8시 45분 , 문제의 징후 발견

미리 출근한 대표님이 바에 앉아 있다. 뭔가를 하시는거 같다. 미국 출장을 다녀오신후 출근이 빨라지신듯 하다. 좀 늦게 오셔도 될 텐데 너무 일찍 출근하시는 듯 하다.

커피를 마시며 상단에 있는 화면을 확인한다.

2번 Dashboard 화면에 Warning 이 보인다. 뭐지?

Warning 이 발생한 서버를 클릭 해본다.

CPU 는 많이 쓰지 않는데 메모리를 100%에 가깝게 많이 쓰고 있다. 뭐 때문이지?

firefox 가 4.11 GB 나 사용하고 있네? 뭔가 문제가 생긴 것 같다.
언제부터 firefox 가 실행되었는지 확인을 해봐야겠다.

이런 13일 부터 메모리가 계속해서 증가 하고 있네 …

8시 47분 , firefox 종료

웹서버에 접속을해서 firefox를 종료해야겠다. 누군가 웹서버에서 firefox를 띄워 놓고 종료를 안 한듯하다.

firefox를 종료하니 메모리가 정상으로 돌아왔다.

8시 50분 , 문제 해결 완료

혼자서 분주하게 Dashboard 앞에서 작업을 하고 웃는 모습을 보신 대표님이, 무슨 일인지 물어보셨다. 대표님에게 간단하게 내용을 설명해드렸더니, 내용을 들으시고 씨이~익 웃으며 가신다.

오늘도 점수를 따고, 하루를 시작했다!

정리

Memory 알림을 설정해놓고, Memory 알림이 발생하여 Dashboard에서 해당문제를 식별후 Process 모니터링을 이용해서 특정 Process의 상태를 분석하고, 빠른시간에 원인을 해결 할 수 있었습니다.

해당 설정은 아래와 같이 할 수 있습니다.

1 . 와탭을 이용해서 CPU, Memory, Disk 의 알림을 설정한다.

서버선택 > 서버 > 알림 메뉴

2 . 알림이 발생하면 Dashboard 에서 어느 서버에 문제가 발생했는지 확인할 수 있다.

3 . 문제가 생긴 서버를 선택하면 해당 서버의 요약화면을 볼 수 있다.

4. 프로세스 메뉴에서 문제를 발생시킨 프로세스를 확인할 수 있다.

서버선택 > 서버 > 프로세스 > 특정 프로세스  메뉴

[보도자료] 와탭 ‘모니터링 솔루션’ – 액티브스택 기술로 지연 구간 분석

와탭 ‘모니터링 솔루션’ – 액티브스택 기술로 지연 구간 분석

모니터링 없이 IT 비즈니스를 운영하는 것은 계기판 없이 운행하는 자동차와 다를 바 없다. 와탭랩스는 기업이 빠르게 변하는 웹 비즈니스 환경에 대응하는 IT 모니터링 솔루션을 개발해 공급한다.

기업 IT 서비스 구성 시 모바일이나 클라우드, 해외 진출을 고려해야 한다. 이때 스케일 업이 아닌 스케일 아웃 전략이 필요하다. 와탭은 기존 모니터링 솔루션이 추적하지 못하는 ‘숨겨진 소스코드 성능 문제’를 인지한다.

회사가 ‘액티브스택(ActiveStack)’이라 이름 붙인 특허(10-2016-0078864) 기술로 경쟁 모니터링 솔루션보다 성능 차원에서 비교 우위를 점한다. 트랜잭션 메소드 레벨까지 프로파일링해 개발자도 찾지 못한 나머지 5%장애를 탐지한다. 개별 트랜잭션 상세 프로파일과 액티브스택 정보를 바탕으로 지연 구간을 분석한다.

지면기사 보기 >>

[보도자료] 와탭랩스, 21일 SW 테스트 자동화 오픈 세미나 참가

와탭랩스, 21일 SW 테스트 자동화 오픈 세미나 참가

와탭랩스는 오는 21일 역삼역 GS타워에서 열리는 STA테스팅컨설팅 주최 ‘SW 테스트 자동화 오픈 세미나’에 참가한다고 밝혔다.

와탭랩스는 애플리케이션 성능관리(APM)를 서비스형 소프트웨어(SaaS)로 제공하는 IT 모니터링 전문업체다.

이날 신현묵 와탭랩스 최고비즈니스책임자(CBO)는 ‘모니터링 도구를 활용한 성능 취약 분야 검증’을 주제로 발표한다. 모니터링 도구를 통해 IT서비스 성능 장애 원인을 알아보는 방법과 함께 실사례를 소개할 계획이다.

이번 세미나에서는 모니터링 도구 외에도 다양한 SW 테스트 자동화 도구와 활용 사례, 도입 방법을 제시한다.

세미나 관계자는 “SW 테스트 자동화에 필요성을 느끼지만 어디서부터 시작해야 할지 고민할 수 있다”며 “SW 테스트 자동화 오픈 세미나에서 조직에 맞는 도구와 도입 방법을 찾아볼 수 있을 것”이라고 말했다.

기사링크 바로가기 >>

[보도자료] 와탭랩스, 노드JS 플랫폼 지원 ‘와탭 APM’ 출시

와탭랩스, 노드JS 플랫폼 지원 ‘와탭 APM’ 출시

와탭랩스는 애플리케이션 성능관리(APM) 상품에서 노드JS(Node.js) 플랫폼을 추가로 지원한다.

IT모니터링 서비스기업 와탭랩스는 자사 APM 상품에서 확장성 있는 네트워크 애플리케이션(특히 서버단) 개발에 사용되는 소프트웨어 플랫폼인 노드JS를 추가로 지원한다고 11일 밝혔다.

노드JS 플랫폼은 자바스크립트 언어를 활용해 비동기식 입출력장치(Non-blocking I/O)와 단일 스레드(thread) 이벤트 루프를 통한 높은 처리 성능을 가지고 있다.

또 내장 HTTP 서버 라이브러리를 포함하고 있어 웹 서버에서 아파치 등 별도 소프트웨어 없이 작동하는 것이 가능하다.

노드JS는 최근 사용이 급증하는 클라우드 환경에 적합하며, 소규모 서버 환경에서 효율성을 중시하는 모바일게임 업계나 스타트업기업들로부터도 주목받고 있다.

특히 이번에 출시된 와탭 APM은 노드JS 플랫폼에서 주로 사용하는 No-SQL, 소켓IO(Socket.io) 등의 패키지 모듈에서도 사용 가능하며, 비동기 방식을 사용하는 노드JS 플랫폼에서 프로파일링 데이터의 정확한 추적이 가능하다.

이동인 와탭랩스 대표는 “국내 최초로 출시된 노드JS 플랫폼인 ‘와탭 APM’으로 뛰어난 효율의 노드JS 환경에 실시간으로 운영과 성능을 한번에 모니터링 할 수 있는 기능이 더해지면 큰 효과를 볼 수 있다”면서 “효율성이 중시되는 소규모 운영 서버를 유지하는 모바일게임 업계 등에 큰 호응이 있을 것”이라고 말했다.

향후 와탭랩스는 PHP 플랫폼의 APM을 출시할 예정이다.

기사링크 바로가기 >>

Node.js APM 출시!

Node.js로 만든 어플리케이션의 성능 모니터링 과연 쉽나?

지구상에서 가장 많은 모듈을 제공하고 있는 NPM,  높은 IO 성능,  적은 시간으로  서비스를 구현할 수 있다는 점에서 Node.js는 많이 사용되는 플랫폼입니다. 특히 빠르게 제품을 만들고 소비자의 반응을 살펴야 하는 모바일 게임분야나 스타트업에서는  적격입니다.

이러한 Node.js에는 특징이 한 가지가 존재합니다. 바로 비동기 방식입니다.  JAVA는 여러 작업을 각 Thread에서 병렬적으로 수행할 수 있는 반면에 Node.js는 직렬적으로 작업을 수행하게 됨을 의미합니다. 다수의 작업들이 있을 때, Node.js는 Thread에서 모든 작업들이 비동기적으로 서로 번갈아가며 수행됩니다.

하지만 Node.js의 성능상의 장점을 가져주는 비동기 방식이라는  특징으로 인해, 개발된 어플리케이션 트랜잭션의 흐름을 순서대로 모니터링 하기 어렵다는 문제가 발생합니다.

모두 알다시피  Node.JS의 높은 성능에  환호하던 소비자들도, 장애시 병목지점을 제대로 파악하지 못해, 사용자가 많은 실제 서비스 운영시 부담을 느끼고 있는 상황이었습니다.

이러한 문제를 깔끔히 해결한,  WhaTap의 Node.js용 모니터링 제품을 비롯하여 다른 제품들에 대해서도 설명드리겠습니다.

Node.js용 성능 모니터링 제품 3가지

Node.js용 성능 모니터링 제품으로 N사, A사, WhaTap 이렇게 3가지 정도를 꼽아 볼 수 있습니다.  N사와 A사는 해외 제품이기 때문에 충분한 지원을 받기에 어려움이 있습니다.  언어적, 시차 문제로 인해 충분한 기술 지원을 받기가 쉽지 않습니다. 앞서 말씀드렸듯이, WhaTap은 국내의 제품으로 국내 사용자가 사용하기 편리하며 기술적 지원 역시 잘 이루어지고 있습니다.

성능 데이터 (실시간 5초단위로 수집하는 것은 와탭) 

성능 모니터링 제품은 성능 데이터로 요청된 URL, 횟수, 응답시간, 에러 등의 정보를 수집합니다.  New Relic, AppDynamics, WhaTap의 세 제품 모두 트랜잭션 프로파일링은 서비스에 요청된 URL 기준으로 처리됩니다. 요청된 URL들의 성능 데이터들을 가져와 분석하게 되는데  New Relic의 경우에는 약 2분마다, AppDynamics는 약 5분마다 데이터를 수집합니다. WhaTap은 5초마다 정보를 수집하여 실시간으로 어플리케이션 서버의 상황을 판단 할수 있으며, 5분 단위분석을 위한 큐브 데이터를 제공하고 있습니다.

또한 New Relic과 WhaTap은 모든 트랜잭션 정보를 수집하고 있지만 AppDynamics는 일부 트랜잭션에 대한 정보만 수집하고 있습니다.

타 회사의 APM은 Node.js의 특징인 Single Thread로 인해 어떤 정보가 어떤 트랜잭션에 해당하는지 구분하지 못하는 한계를 가지고 있습니다.

Continue reading Node.js APM 출시!

지구 상에서 가장 강력한 프로세스 모니터링 기능이 탑재됩니다!

SaaS형 서버 모니터링 서비스 역사상,  지구 상에서 가장 강력한 프로세스 모니터링을 와탭이 선보입니다.

왜 프로세스가 중요하냐!! 여러분 서버의 모든 자원 사용량은 프로세스 자원 사용량의 총 합으로 귀결됩니다. 다시 말하자면 여러분 서버의 자원에 문제가 생긴다면, 그건 어느 프로세스가 과도하게 자원을 사용했다는 의미로 보시면 됩니다.

즉, 문제의 원인은 결국 프로세스에서 찾아야 된다는 것이죠.

매 분 마다 서버/디바이스의 모든 프로세스의 정보를 다 저장하는 새로운 기능을 와탭이 제공할 예정입니다. ‘그런데, 이게 왜 어려운 거죠?’라고 생각하시는 분이 계실 겁니다.

 

문제는 저장 용량 비용

그림 1. 프로세스 그룹 저장의 허들

와탭의 기존 프로세스 모니터링(V1)은 서버의 Top 20개의 프로세스 그룹의 정보만 저장해 왔습니다. 하지만 프로세스 정보는 와탭 모니터링 서비스 전체 저장소 공간의 75%를 차지하고 있었습니다. 어떤 고객분께 새로운 프로세스 모니터링(V2)에 대해 미리 말씀 드렸더니 다음과 같이 물어보셨습니다. “음.. 모든 프로세스 정보를 다 저장한다구요? 그건 돈만 많이 들이면 되는 거 아닌가요?” 네, 이렇게 물어보실 수 있습니다.

Continue reading 지구 상에서 가장 강력한 프로세스 모니터링 기능이 탑재됩니다!