AI時代におけるダウンタイムコストの軽減

予測故障解析とリモートハンズ契約により、企業がダウンタイムコストを1時間あたり最大$500,000削減する方法を学びましょう。20%のリターンを示す詳細なケーススタディとともに、AIとHPC投資を保護するROI戦略をご紹介します。

AI時代におけるダウンタイムコストの軽減

ハードウェア障害をある程度の精度で予測する能力は、情報技術(IT)に大規模な資本投資を行うサービスプロバイダーにとって、膨大なコスト削減の可能性を提供します。大規模で高コストな高性能コンピューティング(HPC)と人工知能(AI)プラットフォームを運用する企業顧客にとって、サービス提供の可用性がすべてです。システムのダウンは顧客をロックアウトし、リソースを遊休状態にして、大きなコストで無用の長物とします。この種の障害は収益の損失を引き起こし、従業員全体の生産性に影響を与え、企業のブランドを損なう可能性があります。業界によって異なりますが、計画外ダウンタイム1時間の平均コストは、1時間あたり$100,000から$500,000を大きく超える範囲になることが研究で示されています。[1] [2]

予測的故障解析(PFA)の登場

大量の履歴データを評価することで、予測的故障解析(PFA)は障害の発生可能性について貴重な洞察を提供できます。チップセット、回路基板、ハードドライブ、はんだ接続部はすべて有限の耐用年数を持っています。履歴故障データの傾向は、将来の故障の時間軸を示す可能性があります。

大型設備や自動車メーカー(およびその顧客)にとって、PFAは資産の耐用年数の向上を提供し、将来の支出を最大5%削減できる可能性があります。PFAはまた、オペレーターや技術者がより自由に利用でき、安価な時期にメンテナンスをスケジュールするために使用でき、最大20%の効率性と節約を生み出すことができます。[3]

多数の要因がPFAの性能に影響を与える可能性があります。対象システムの平均ワークロード、使用される履歴データの範囲、関連する機械学習(ML)やディープラーニング(DL)アルゴリズムによって、PFAの精度が疑問視される可能性があります。

線形回帰や多項式回帰は残存耐用年数(RUI)を決定するためによく使用され、Long Short-Term Memory(LSTM)やランダムフォレストアルゴリズムは、様々な成功度で故障予測を改良するために使用できます。[4] [5] [6]

PFAには明確な有形の利益があることは明らかですが、完全無欠ではありません。同じレベルのサービス可用性を提供し、資本投資の価値を保護するためには、PFAを使用するサポートプログラムをリモートハンズ契約で補強することを検討するのが賢明です。

保険ポリシーとしてのリモートハンズ

PFAと連携してリモートハンズを使用することで、計画停止と計画外停止の両方に利益をもたらします。

計画停止は十分に事前にスケジュールでき、リソースが自由に利用でき、最も手頃な価格の時にリソースを割り当てることができます。リモートハンズプロバイダーはスケールメリットも享受しています。豊富なリソースを展開できるため、独自の技術者を雇用、訓練、管理するよりも大幅な節約が可能です(必要なスキルセットによって、完全負担エンジニア1人でも年間6桁以上のコストが容易に発生します)。

計画外停止においては、サービスの復旧が主要な関心事です。リモートハンズ契約なしの計画外停止は解決により長い時間がかかります。現場で問題のトラブルシューティングと解決のために展開されるリソースは、まず検証、保険、オンボーディングが必要になります。スケールでリソースを持つリモートハンズプロバイダーは、すでにリソースを精査し割り当てているため、より迅速な応答時間をもたらします。

戦略的技術投資

サービスの性質によっては、大規模環境の持続的な障害は容易に数百万ドルのコストをもたらす可能性があります。リモートハンズ契約単体で、またはPFAを含むより広範な災害復旧計画の一部として運用することで、費用項目として扱うか、より大規模なソフトウェアやサービスサブスクリプションの一部として資本化することも可能です。

運用コストのわずかな増加は、長期間のサービス停止に関連する数百万ドルの損失から保護する可能性があります。

リモートハンズサポートへの投資を正当化するためにどのようなアプローチを使用すべきでしょうか?企業財務指標は企業によって異なりますが、いくつかの例を示すことができます。

ケーススタディ

北米のデータセンターにある3つの環境を1年間カバーするために$250,000のリモートハンズ契約を評価しているとします。ダウンタイムの推定コストは、遊休リソース、失われた収益、ブランドへの影響などを含めて1時間あたり$100,000です。ハードウェア故障によって最後に障害を経験した時、アプリケーションは6時間ダウンしました。会社への純粋な影響は$600,000でした。

企業財務は、投資がハードルレート(最小受容収益率またはMAARとしても知られる)10%をクリアしない限り、IT支出を承認しません。

リモートハンズ契約の予想される利益は、計画外停止の平均復旧時間(MTTR)を短縮することです。推定では、MTTRを大幅に短縮できるとされています。前回の障害でMTTRを50%短縮した場合、3時間早くサービスを復旧することで$300,000を節約できたでしょう。

企業財務は、将来の計画外ダウンタイムを削減する保険ポリシーとしてこのリモートハンズ契約の購入を承認すべきでしょうか?

ROIの簡単な公式を使用します:

ROI = (純利益 / 投資コスト) * 100

この場合、純利益は$300,000の節約から$250,000の契約コストを差し引いた$50,000になります。

ROI = ($300,000-$250,000)/$250,000 * 100

$50,000を$250,000で割ると20%、つまり財務が要求するMARRの2倍になります。

(この収益は1回の障害のみに対して測定されることに留意してください。1年間に複数の計画外障害があれば、節約はかなり高くなります。)

企業財務はリモートハンズ契約への投資を承認すべきです。

まとめ

人工知能は予測的故障解析の分野で大きな進歩を遂げており、PFAの有効性は今後数か月、数年でのみ向上するでしょう。

その間、投資保護の必要性は残ります。リモートハンズ契約への戦略的投資は、計画外停止の財務的影響を軽減し、計画停止ウィンドウの柔軟性を活用するのに役立ちます。

注記

[](#_ftnref1)1[] https://medium.com/@brijesh_soni/why-random-forests-outperform-decision-trees-a-powerful-tool-for-complex-data-analysis-47f96d9062e7

[2] Yadav, D. K., Kaushik, A., & Yadav, N. (n.d.). Predicting machine failures using machine learning and deep learning algorithms. ScienceDirect. https://www.elsevier.com/locate/smse

[3] https://www.bakerhughes.com/bently-nevada/blog/unplanned-downtime-key-disruptor-industry

[4] https://medium.com/@jatin2707/machine-failure-prediction-a-comprehensive-guide-524726c3b1fd

[5] https://www.atlassian.com/incident-management/kpis/cost-of-downtime

[6] From "Predictive Maintenance: Deloitte's Approach" https://www2.deloitte.com/content/dam/Deloitte/us/Documents/process-and-operations/us-predictive-maintenance.pdf

トピック:リモートハンズ、機械学習(ML)、人工知能(AI)、ディープラーニング(DL)、生産性、データセンター、クラウド、予測的故障解析(PFA)、リカレントニューラルネットワーク(RNN)、高性能コンピューティング(HPC)、企業財務、戦略的投資、線形回帰、Long Short-Term Memory(LSTM)、ランダムフォレスト、ポートフォリオ理論。

お見積り依頼_

プロジェクトについてお聞かせください。72時間以内にご回答いたします。

> TRANSMISSION_COMPLETE

リクエストを受信しました_

お問い合わせありがとうございます。弊社チームがリクエストを確認し、72時間以内に回答いたします。

QUEUED FOR PROCESSING