friendsmachbase
213
2021-09-30 11:06:48
0
217

AI 예지보전을 위한 TSDB의 활용



제조설비 예지보전

제조설비 예지보전(Predictive Maintenance)은 최근 PHM(Prognostics and Health Management)이라는 보다 큰 의미의 용어로 불리고 있으며, 설비 이상에 대한 사전 진단 및 설비, 부품 등의 수명을 예측해 최적의 설비상태를 유지하는 것을 뜻한다. 이를 통해 제조업은 품질 향상과 납기를 준수하게 되어 경쟁력을 강화하고, 빅데이터 분석(AI, 통계)을 토대로 객관적인 근거를 바탕으로 공장의 다운타임을 줄이는 동시에 실질적인 비용손실을 감소시키는 효과를 가져온다. 통상적으로 PHM의 실행은 다음과 같은 4단계를 거친다.

(1) 정보 수집 : 예측할 장비의 센서로부터 데이터를 수집하고, 특징 신호 추출

(2) 이상 탐지 : 운전 신호 측정 및 비정상 패턴 발견 및 알람

(3) 상태 진단 : 이상 유무, 결함 원인 파악, 건전성 종합 평가

(4) 고장 예측 : 잔존 수명 예측 (RUL:Remaining Useful Life)

1. 정보 수집

센서 데이터는 Low Sampling Data와 High Sampling Data로 나뉜다. Low Sampling Data는 온도, 기압, 습도, 광도 등 초당 1건 ~ 분당 1건의 수집 주기가 낮은 데이터들이며 건물의 실내 온도, 펌프의 압력, 비닐하우스의 습도 등에 해당한다. 주요 용도는 시스템의 전체적인 상황을 긴 기간 동안 모니터링하는 것이며 느슨한 대응이 일반적이다. High Sampling Data는 진동, 음향(소리), 전류, 가속도, 충격 등 초당 10건 ~ 60,000건의 수집 주기가 높은 데이터들이며 압연롤러의 진동, 무인통로의 음향, 교량의 떨림과 진동 등에 해당한다. 주요 용도는 특정 장비/시스템에 대한 집중적인 감시를 하는 것이며 긴급한 대응이 주로 발생한다. 그러나 정보 수집 단계에서는 다음과 같은 현실적인 문제들이 많이 발생하기 때문에 보다 고도화된 데이터 처리 시스템과 면밀한 실행 계획이 필요하다.

ㆍ데이터 수집 : 데이터에 대한 프로토콜, 네트워크 형태가 다 달라서 데이터 변환이 필요

ㆍ데이터 저장 : 고속의 데이터, 장기간의 데이터, 보안 및 심리적 안정성

ㆍ데이터 전송 : 네트워크 매개의 불안정성, 지리적인 거리, 실시간 처리의 요구

ㆍ데이터 추출 : 얼마나 많이, 얼마나 자주, 얼마나 신속하게 데이터를 가져올지에 대한 고려

2.이상 탐지(Anomaly Detection)

이상 탐지는 상태 진단과 고장 예측의 전 단계로써 기존의 데이터와 달라 의심을 불러일으키는 희귀 항목, 이벤트를 통해 문제가 생겼는지 탐지하는 단계이다. 이상 탐지의 가장 큰 문제는 정상과 비정상을 어떻게 나누어야 하는가 이다. 개념적으로는 센서 데이터 흐름의 패턴을 통해 과거에 있었던 정상이라고 판단되는 패턴과 다른 상황이 발생하면 비정상으로 보고 있으나, 이는 해당 데이터를 판별하는 상황과 조건 등에 따라 유동적이기도 하다. 과거의 이상 탐지 기술은 비정상 패턴 관리에 초점을 맞춰서 오직 학습된 데이터의 결과만 예측 가능했다면, 최근의 트렌드는 비정상 패턴의 데이터를 관리하지 않고 정상적인 데이터를 학습하고 그 외의 다른 데이터가 발생하면 비정상일 확률이 높은 데이터 패턴으로

판단하며, 이러한 판단의 정확도를 어떻게 높이느냐가 중요한 관건이 된다. 이에 따라 제약된 소규모 데이터 처리를 하던 과거의 기술은 사라지고, 대규모 빅데이터 입력을 통한 패턴 자율 구축이 가능한 Anomaly Detection 기술로 진화하고 있다.

3. 상태 진단

그 다음 중요한 단계는 상태 진단이다. 상태 진단은 아래 3가지 항목으로 나눠 파악할 수 있다.

ㆍ이상 유무 파악 : 정말 문제인가?, “False Alarm”이 아닌가?

ㆍ결함 원인 파악 : 장애의 원인 부품은 무엇인가?, 얼마나 자주 발생하는가?, 어느 부위인가?

ㆍ건전성 종합 평가 : 전체적으로 제품의 상태는 어떠한가?, 관리자의 평가는?

일반적으로 해당 패턴이 정상인지 아닌지는 주어진 AI 모델을 통해 결정된 여러 차원의 추론 결과값(Anomaly score)을 통해 해당 패턴의 정상 유무를 판별한다.

즉, 해당 추론 결과값이 1개인 경우는 일차원 직선 위의 특정 점으로 표현될 수 있고, 2개의 경우는 평면 공간상의 특정점으로 수렴된다. 그리고 그 값의 크기와 위치에 따라 특정 영역의 그룹으로 모이면 정상으로 판별하고, 특정 그룹을 벗어나는 점이 나오면 비정상으로 판단하는 것이 일반적이다.

그러나 이 로직을 수행하면 정상적으로 판별하지 못하는 경우가 상당히 많은데, 그 원인은 다음과 같이 3가지 정도로 나누어서 대응하고 있다.

(1) Anomaly Score 범위의 오류

→ 최적의 범위로 진화하고 장기간에 걸친 튜닝이 필요하다.

(2) 데이터의 부족 혹은 오염된 데이터

→ 더 많은 데이터 수집과 데이터 정련/관리가 필요하다.

(3) 모델 선택의 오류

→ 레퍼런스 모델 확인과 재학습 및 검증이 필요하다

4.고장 예측

고장 예측은 가장 복잡하고 어려운 단계이다. 가장 잘못 알려진 상식 중 하나가 데이터만 모으면 예지보전을 할 수 있다고 예상하는 것인데 이것은 실제 현실과는 꽤 많이 다르다. 고장을 예측할 수 있는 방법에 대한 실제 모델은 3종류 정도 있는데, 이 3가지 모델의 공통적인 특징은 실제 장애가 발생한 이력 데이터를 기반으로 그 모델을 구축해야 한다는 것이다. 즉, 고장이 실제로 발생했던 과거의 경험 데이터 없이는 정확한 예측이 불가능하다는 것이고, 이는 각 기업이 직접 수집부터 고장까지의 모든 Whole life data를 수집해야 하며, 그것도 1회가 아닌 여러 회를 반복해서 보유하고 있어야 가능하다는 의미이다. 그리고 실제로 전체 단계에 대한 데이터 구축 의사결정을 하게 되더라도, 아래와 같은 현실적인 문제가 도사리고 있다.


자세한 내용은 아래 URL을 통해 참고 부탁드립니다.

https://kr.machbase.com/ai

1
  • 댓글 0

  • 로그인을 하시면 댓글을 등록할 수 있습니다.