
Het vermogen om hardwarestoringen met enige nauwkeurigheid te voorspellen biedt het potentieel voor enorme besparingen voor serviceproviders met grote kapitaalinvesteringen in informatietechnologie (IT). Voor enterprise-klanten die kostbare high-performance computing (HPC) en artificial intelligence (AI) platforms op schaal bedienen, is de beschikbaarheid van hun serviceaanbod van cruciaal belang: Een uitgevallen systeem sluit klanten uit en houdt resources gevangen, waardoor ze nutteloos worden tegen hoge kosten. Een storing van dit soort kan leiden tot omzetverlies, de algehele productiviteit van werknemers beïnvloeden en het merk van een bedrijf beschadigen. Afhankelijk van de industrie hebben studies aangetoond dat de gemiddelde kosten van een uur ongeplande downtime kunnen variëren van $100.000 per uur tot ruim $500.000 per uur.[1] [2]
Kennismaking met Predictive failure analysis (PFA)
Door het evalueren van grote hoeveelheden historische data kan predictive failure analysis (PFA) waardevolle inzichten bieden in de waarschijnlijkheid van een storing. Chipsets, printplaten, harde schijven en gesoldeerde verbindingen hebben allemaal een beperkte gebruiksduur. Trends in historische storingsdata kunnen wijzen naar een tijdshorizon voor toekomstige storingen.
Voor grote apparatuur- of autofabrikanten (en hun klanten) kan PFA mogelijk verbeteringen bieden aan de levensduur van assets, wat leidt tot een verminderde toekomstige uitgaven van maximaal 5%. PFA kan ook worden gebruikt om onderhoud in te plannen wanneer operators en technici vrijer beschikbaar en goedkoper zijn, wat efficiënties en besparingen van maximaal 20% oplevert.[3]
Talloze factoren kunnen de prestaties van PFA beïnvloeden. Afhankelijk van de gemiddelde workload van het betreffende systeem, de omvang van de gebruikte historische data en de betrokken machine learning (ML) of deep learning (DL) algoritmen, kan de nauwkeurigheid van PFA in twijfel worden getrokken.
Lineaire en polynomiale regressies worden vaak gebruikt om de resterende gebruiksduur (RUI) te bepalen, terwijl Long Short-Term Memory (LSTM) en random forest-algoritmen kunnen worden gebruikt om storingsvoorspellingen te verfijnen met wisselende mate van succes. [4] [5] [6]
Hoewel het duidelijk is dat er tastbare voordelen zijn met PFA, is het niet onfeilbaar. Om hetzelfde niveau van servicebeschikbaarheid te bieden en de waarde van kapitaalinvesteringen te beschermen, is het verstandig om te overwegen elk supportprogramma dat PFA gebruikt aan te vullen met een remote hands-contract.
Remote Hands als Verzekeringspolis
Het gebruik van remote hands in combinatie met PFA biedt voordelen voor zowel geplande als ongeplande storingen.
Een geplande storing kan ruim van tevoren worden ingepland, waardoor resources kunnen worden toegewezen wanneer ze vrij beschikbaar en het meest betaalbaar zijn. Remote hands-providers genieten ook van schaalvoordelen: Met overvloedige resources om in te zetten, kunnen aanzienlijke besparingen worden behaald ten opzichte van het inhuren, trainen en beheren van je eigen technici. (Een volledig belaste engineer kan gemakkelijk zes cijfers of meer kosten per jaar, afhankelijk van de vereiste skillsets).
Bij elke ongeplande storing is het herstel van de service de primaire zorg. Een ongeplande storing zonder een remote hands-contract zal langer duren om op te lossen. De resources die worden ingezet om het probleem ter plaatse op te lossen en op te sporen, zouden eerst moeten worden geverifieerd, verzekerd en ingevoerd voordat ze worden ingezet. De remote hands-provider, met resources op schaal, zal al resources hebben geverifieerd en toegewezen, wat resulteert in een snellere responstijd.
Strategische Technologie-investering
Afhankelijk van de aard van de service kan een aanhoudende storing voor een grote omgeving gemakkelijk miljoenen dollars kosten. Een remote hands-contract op zichzelf of als onderdeel van een breder disaster recovery-plan dat PFA omvat, kan worden behandeld als een kostenpost, of mogelijk zelfs gekapitaliseerd als onderdeel van een groter software- of serviceabonnement.
Een kleine toename in operationele kosten zou je zeer goed kunnen beschermen tegen de miljoenen dollars aan verliezen die gepaard gaan met een langdurige servicestoring.
Welke benadering zou je moeten gebruiken om een investering in remote hands-ondersteuning te rechtvaardigen? Corporate finance-statistieken variëren van bedrijf tot bedrijf, maar een paar illustraties kunnen worden getekend.
Case Study
Je evalueert een remote hands-contract voor $250.000 om drie omgevingen in datacenters in Noord-Amerika gedurende één jaar te dekken. Je geschatte kosten van downtime zijn $100.000 per uur all-in (inclusief gestrande of inactieve resources, verloren omzet, merkimpact, enz.). De laatste keer dat je een storing ervaarde door gefaalde hardware, was je applicatie zes uur offline. De netto impact op het bedrijf was $600.000.
Corporate finance zal IT-uitgaven niet goedkeuren tenzij een investering een hurdle rate (soms bekend als een minimaal acceptabel rendement of MAAR) van 10% haalt.
Een verwacht voordeel van een remote hands-contract is het verminderen van de mean-time-to-recovery (MTTR) voor een ongeplande storing. Schattingen suggereren dat MTTR aanzienlijk kan worden verminderd. Een vermindering in MTTR van 50% voor de vorige storing zou $300.000 hebben bespaard door de service drie uur sneller te herstellen.
Zou corporate finance de aankoop van dit remote hands-contract als een verzekeringspolis moeten autoriseren om toekomstige ongeplande downtime te helpen verminderen?
We gebruiken een eenvoudige formule voor ROI:
ROI = (Nettowinst / Kosten van Investering) * 100
In dit geval zou de nettowinst de $300.000 besparingen minus de kosten van het $250.000 contract zijn, of $50.000.
ROI = ($300.000-$250.000)/$250.000 * 100
$50.000 gedeeld door $250.000 is 20%, of het dubbele van de MARR vereist door finance.
(Houd in gedachten, dit rendement wordt gemeten tegen slechts één storing. Met meerdere ongeplande storingen in een enkel jaar zouden de besparingen aanzienlijk hoger zijn.)
Corporate finance zou de investering in het remote hands-contract moeten goedkeuren.
Samenvatting
Artificial intelligence heeft grote vooruitgang geboekt op het gebied van predictive failure analysis, en de effectiviteit van PFA zal alleen maar toenemen in de komende maanden en jaren.
Ondertussen blijft de behoefte aan investeringsbescherming bestaan. Een strategische investering in een remote hands-contract kan helpen de financiële impact van ongeplande storingen te beperken, terwijl het je helpt te profiteren van de flexibiliteit van geplande downtimevensters.
Notities
[](#_ftnref1)1[] https://medium.com/@brijesh_soni/why-random-forests-outperform-decision-trees-a-powerful-tool-for-complex-data-analysis-47f96d9062e7
[2] Yadav, D. K., Kaushik, A., & Yadav, N. (n.d.). Predicting machine failures using machine learning and deep learning algorithms. ScienceDirect. https://www.elsevier.com/locate/smse
[3] https://www.bakerhughes.com/bently-nevada/blog/unplanned-downtime-key-disruptor-industry
[4] https://medium.com/@jatin2707/machine-failure-prediction-a-comprehensive-guide-524726c3b1fd
[5] https://www.atlassian.com/incident-management/kpis/cost-of-downtime
[6] From "Predictive Maintenance: Deloitte's Approach" https://www2.deloitte.com/content/dam/Deloitte/us/Documents/process-and-operations/us-predictive-maintenance.pdf
Onderwerpen: Remote hands, machine learning (ML), artificial intelligence (AI), deep learning (DL), productiviteit, datacenters, cloud, predictive failure analysis (PFA), recurrent neural network (RNN), high-performance computing (HPC), corporate finance, strategische investeringen, lineaire regressie, Long Short-Term Memory (LSTM), random forests, portfoliotheorie.