サービスやシステムの障害は、あってはいけないことですが事実上、根絶はできません。
従来は自社でサーバーを用意したり、データセンターを用意しサービスを構築することが多かったのですが、マイクロソフト社のAzureやアマゾン社のAWS、グーグル社のGCPなどクラウド上のサーバーに主流が移っています。
前述のクラウド上のサーバーそのものに障害が起きた場合は、間借りしているサービスも同様に障害に陥るので手出しができません。
AWSやAzure上では多くのサービスが展開されていますので影響範囲は甚大です。
その分、盤石な監視や管理体制を敷いているはずですが、それでも機能不全に陥ることはあるのです。
そういった自然災害のようなケースを除いても障害は起こります。
サービス提供側の資質を見極めるためにも、注目したいのは障害の検知スピードと復旧のスピードです。
時には、原因がどこにあるのか特定しづらいような不運なアクシデントも起こります。
経験値の浅い会社はあたふたするばかりで、どこから手を付けていいのかすら分からないことさえあります。
障害の検知から復旧までの連携が整っていない会社ではどうでしょうか。
具体的には障害報告から復旧報告までのスピードに差が出ます。
現実問題、原因特定に時間がかかり何日も機能が戻らない、ということもあります。
障害発生から数日たっているにもかかわらず、気づかずにお客様からの指摘ではじめて障害を知るという信じられないずさんな管理体制のベンダーも存在するといいます。
事実、そのような理由で乗り換えを検討しているという問い合わせは寄せられます。
サポート体制や、障害対応などは導入前に評価しづらいポイントではありますが長く付き合っていくことを考えるとしっかり吟味することをお勧めいたします。
一定規模の会社になると、いくつものプロダクトを抱えていることが多いはずです。
同じ社内に、セキュリティや監視をサービスとして提供している部門がある会社は一層、障害に対して神経質な体制を敷いています。
つまり、セキュリティに特化した企業ですから障害に対してもスピーディに検知し復旧することに長けています。
もし、甲乙つけがたい製品で頭を悩ませたときには一つの目安としてどのようなプロダクトを展開しているかといった視点で見るとよいかもしれません。
目先の価格差だけでは決めがたい、選定すべき理由が見つかるかもしれません。