안녕하세요! 주니어 개발자 줄여서 주발자입니다.
이번에 24시간 운영이 필요한 서비스에서 사용할 수 있는 센티넬이라는 서비스를 기획했습니다.
센티넬이란?
24시간 가동되어야 하는 서비스의 운영 단계에서, 사고 발생을 기록하고, 비슷한 타입의 사고가 발생할 경우 해당 기록을 기반, AI 신뢰도를 검증받아 해결 방법을 추천받고, 사고 해결 과정을 함께할 수 있는 서비스입니다.
예전에 파견을 통해 24시간 서비스의 SM을 하던 때, 야간에, 배경지식이 없는 제가 혼자 근무할 때 사고가 발생한 경험을 토대로 ‘주니어 개발자, 혹은 모니터링 근무자도 예전 사고 발생 지식을 재사용할 수 있을만큼 유용한 서비스를 만들 수는 없을까?‘ 라는 취지에서 만들었습니다.
더 나아가, 비슷한 사고인데 막상 해당 사고를 담당했던 인원이 부재중일 경우, 다른 사람이 그 해결 컨텍스트를 다시 사용할 수 있도록 도와주는 서비스를 목표로 하고 있습니다.
현재, 랜딩 페이지와 데모 서비스 앱(FE Only)이 있는데 혹시 선배님들의 피드백을 받을 수 있으면 감사하겠습니다..!
랜딩페이지 URL : Sentinel — Stop Solving the Same Incident Twice
데모 서비스 URL : Sentinel
더 나아가, Prometheus, Grafana, Slack 등과 같이 여러 채널을 통해 데이터를 받고, 정제하여 가장 해결 가능성이 높은 ‘해결 체크리스트’를 제공하는 단계를 도입하려고 합니다.
폐가 안된다면, 한번 사용해봐주시고 좋았던점, 부족한점 작성해주시면 감사하겠습니다.
만약! 정말 만약! ‘이 서비스, 우리 팀에 적용해도 괜찮을거같은데?‘ 라는 생각이 드신다면, 랜딩 페이지 하단의
Let's talk about your incidents 섹션을 작성해주시면 정말 열심히 구현해서 서비스 제공해드리도록 하겠습니다!
감사합니다!
댓글을 쓰려면 로그인이 필요합니다.