
어느 정도 정확도를 가지고 하드웨어 장애를 예측할 수 있는 능력은 정보기술(IT)에 대규모 자본 투자를 한 서비스 제공업체들에게 엄청난 비용 절감의 가능성을 제공합니다. 대규모로 비용이 많이 드는 고성능 컴퓨팅(HPC) 및 인공지능(AI) 플랫폼을 운영하는 기업 고객들에게는 서비스 제공의 가용성이 모든 것입니다: 시스템 다운은 고객을 차단하고 리소스를 가두어 막대한 비용으로 이를 쓸모없게 만듭니다. 이런 종류의 중단은 수익 손실을 야기하고, 전반적인 직원 생산성에 영향을 미치며, 회사의 브랜드에 손상을 줄 수 있습니다. 업계에 따라 연구에 따르면 계획되지 않은 다운타임 한 시간의 평균 비용은 시간당 $100,000에서 $500,000 이상까지 다양할 수 있습니다.[1] [2]
예측 장애 분석(PFA)의 등장
대량의 과거 데이터를 평가함으로써, 예측 장애 분석(PFA)은 중단 가능성에 대한 귀중한 통찰력을 제공할 수 있습니다. 칩셋, 회로 기판, 하드 드라이브, 그리고 납땜 연결부는 모두 유한한 유용 수명을 가지고 있습니다. 과거 장애 데이터의 트렌드는 향후 장애의 시간 범위를 가리킬 수 있습니다.
대형 장비 또는 자동차 제조업체(및 그들의 고객)에게 PFA는 잠재적으로 자산 수명 예측 개선을 제공하여 향후 지출을 최대 5%까지 줄일 수 있습니다. PFA는 또한 운영자와 기술자가 더 자유롭게 이용 가능하고 비용이 저렴할 때 유지보수를 예약하는 데 사용될 수 있어, 최대 20%의 효율성과 비용 절감을 창출합니다.[3]
PFA의 성능에 영향을 미칠 수 있는 수많은 요소들이 있습니다. 해당 시스템의 평균 워크로드, 사용된 과거 데이터의 범위, 그리고 관련된 머신 러닝(ML) 또는 딥 러닝(DL) 알고리즘에 따라 PFA의 정확도가 의문시될 수 있습니다.
선형 및 다항식 회귀는 종종 잔여 유용 수명(RUI)을 결정하는 데 사용되며, Long Short-Term Memory(LSTM) 및 랜덤 포레스트 알고리즘은 다양한 성공도를 가지고 장애 예측을 세밀하게 조정하는 데 사용될 수 있습니다. [4] [5] [6]
PFA에 명백한 이점이 있다는 것은 분명하지만, 이것이 완벽하지는 않습니다. 동일한 수준의 서비스 가용성을 제공하고 자본 투자의 가치를 보호하기 위해, PFA를 사용하는 모든 지원 프로그램을 원격 핸즈 계약으로 보강하는 것을 고려하는 것이 현명합니다.
보험 정책으로서의 원격 핸즈
PFA와 함께 원격 핸즈를 사용하는 것은 계획된 중단과 계획되지 않은 중단 모두에 대해 이점을 제공합니다.
계획된 중단은 미리 충분히 예약될 수 있어, 리소스가 자유롭게 이용 가능하고 가장 저렴할 때 할당할 수 있습니다. 원격 핸즈 제공업체들은 또한 규모의 경제를 누립니다: 배치할 풍부한 리소스를 가지고 있어, 자체 기술자를 고용, 훈련, 관리하는 것보다 상당한 절약이 가능합니다. (필요한 기술 세트에 따라 완전히 부담된 엔지니어 한 명이 연간 쉽게 6자리 수 이상의 비용이 들 수 있습니다).
모든 계획되지 않은 중단에서 서비스 복구가 주요 관심사입니다. 원격 핸즈 계약이 없는 계획되지 않은 중단은 해결하는 데 더 오래 걸릴 것입니다. 현장에서 문제를 해결하기 위해 배치된 리소스는 먼저 확인, 보험 가입, 온보딩을 거쳐야 배치될 수 있습니다. 대규모 리소스를 가진 원격 핸즈 제공업체는 이미 검증되고 할당된 리소스를 보유하여 더 빠른 응답 시간을 제공합니다.
전략적 기술 투자
서비스의 성격에 따라, 대규모 환경의 지속적인 중단은 쉽게 수백만 달러의 비용을 초래할 수 있습니다. 단독으로 또는 PFA를 포함하는 더 광범위한 재해 복구 계획의 일부로 운영되는 원격 핸즈 계약은 비용 항목으로 처리되거나, 잠재적으로 더 큰 소프트웨어 또는 서비스 구독의 일부로 자본화될 수도 있습니다.
운영 비용의 약간의 증가는 장기간의 서비스 중단과 관련된 수백만 달러의 손실로부터 당신을 보호할 수 있을 것입니다.
원격 핸즈 지원에 대한 투자를 정당화하기 위해 어떤 접근법을 사용해야 할까요? 기업 금융 지표는 회사마다 다르지만, 몇 가지 예시를 들 수 있습니다.
사례 연구
북미의 데이터 센터에 있는 세 환경을 1년간 커버하기 위해 $250,000의 원격 핸즈 계약을 평가하고 있습니다. 예상 다운타임 비용은 시간당 $100,000 전체입니다(좌초되거나 유휴 리소스, 수익 손실, 브랜드 영향 등을 포함). 마지막으로 하드웨어 장애로 인한 중단을 경험했을 때, 애플리케이션이 6시간 동안 다운되었습니다. 회사에 대한 순 영향은 $600,000였습니다.
기업 금융부는 투자가 10%의 허들 레이트(때때로 최소 허용 수익률 또는 MAAR로 알려짐)를 통과하지 않으면 IT 지출을 승인하지 않을 것입니다.
원격 핸즈 계약의 예상되는 이점은 계획되지 않은 중단에 대한 평균 복구 시간(MTTR)을 줄이는 것입니다. 추정에 따르면 MTTR이 상당히 줄어들 수 있습니다. 이전 중단에 대해 MTTR을 50% 줄이는 것은 서비스를 3시간 더 빠르게 복구하여 $300,000를 절약했을 것입니다.
기업 금융부는 향후 계획되지 않은 다운타임을 줄이는 데 도움이 되는 보험 정책으로서 이 원격 핸즈 계약 구매를 승인해야 할까요?
ROI에 대한 간단한 공식을 사용하겠습니다:
ROI = (순이익 / 투자 비용) * 100
이 경우, 순이익은 $300,000 절약에서 $250,000 계약 비용을 뺀 $50,000가 될 것입니다.
ROI = ($300,000-$250,000)/$250,000 * 100
$50,000을 $250,000로 나눈 것은 20%로, 금융부에서 요구하는 MARR의 두 배입니다.
(이 수익은 하나의 중단에 대해서만 측정된다는 것을 명심하십시오. 1년에 여러 번의 계획되지 않은 중단이 있으면 절약액이 상당히 높아질 것입니다.)
기업 금융부는 원격 핸즈 계약에 대한 투자를 승인해야 합니다.
요약
인공지능은 예측 장애 분석 분야에서 큰 진전을 이루었으며, PFA의 효과는 앞으로 몇 달, 몇 년 동안만 증가할 것입니다.
그동안 투자 보호의 필요성은 남아 있습니다. 원격 핸즈 계약에 대한 전략적 투자는 계획되지 않은 중단의 재정적 영향을 완화하는 데 도움이 될 수 있으며, 계획된 다운타임 창의 유연성을 활용하는 데 도움이 됩니다.
참고자료
[](#_ftnref1)1[] https://medium.com/@brijesh_soni/why-random-forests-outperform-decision-trees-a-powerful-tool-for-complex-data-analysis-47f96d9062e7
[2] Yadav, D. K., Kaushik, A., & Yadav, N. (n.d.). Predicting machine failures using machine learning and deep learning algorithms. ScienceDirect. https://www.elsevier.com/locate/smse
[3] https://www.bakerhughes.com/bently-nevada/blog/unplanned-downtime-key-disruptor-industry
[4] https://medium.com/@jatin2707/machine-failure-prediction-a-comprehensive-guide-524726c3b1fd
[5] https://www.atlassian.com/incident-management/kpis/cost-of-downtime
[6] From "Predictive Maintenance: Deloitte's Approach" https://www2.deloitte.com/content/dam/Deloitte/us/Documents/process-and-operations/us-predictive-maintenance.pdf
주제: 원격 핸즈, 머신 러닝(ML), 인공지능(AI), 딥 러닝(DL), 생산성, 데이터 센터, 클라우드, 예측 장애 분석(PFA), 순환 신경망(RNN), 고성능 컴퓨팅(HPC), 기업 금융, 전략적 투자, 선형 회귀, Long Short-Term Memory(LSTM), 랜덤 포레스트, 포트폴리오 이론.