2015年7月7日火曜日

システム変更トラブルに対する実践的な原因分析・対策立案手法

こんにちは、山崎です。

今回は、変更管理プロセスにおける諸問題と改善策について取り上げます。
システム保守の現場では、変更管理プロセスにおいて重大な問題が発生するケースが多くあります。

・変更管理の管理手法は導入しているが、実施作業負荷が高い等の理由から手法そのものが形骸化しており、度々、ヒューマンエラーに起因する問題が発生する。
・例外的な納期で受け入れた為、テストや運用段階になってから変更を起因とした障害が多発している。
・変更要求の手順化・ルール化がされルーチンワークとして実施している故に、システム変更に対する有用性や経済性が妥当であるか評価できず、ただ言われるままに受け入れている。

 これらを解決していくためには、様々な事象に対して対策を講じていかなければなりません。しかし、どれから取り掛かるべきなのか悩ましい状況があります。過去実施してきた対策で効果が認められていなかったり、保守勢力の抵抗にあったり、改善の為のリソースが足りなかったりと阻害要因が山積みです。

 今回、医療や原子力保全の現場等で用いられている、ヒューマンファクター工学に基づき、トラブルや障害を効果的に分析することを目的として開発された手法(Systematic Approach For Error Reduction)を変更管理プロセスでの活用を視野に入れて紹介したいと思います。なぜ、この分析手法を選んだのかと言いますと、通常では分析に費やすコストに比例して分析の深度は高まりますが、現場の人でも比較的手軽に利用できることを目的にされている手法ですので適応しやすいと考えました。

手順は以下の通りです。

手順1:
事象の整理
事象や行動を整理して、事実を把握するために、時系列事象関連図を作成します。
たとえば、事象に関わった要素(保守担当者、事業部担当者、変更管理責任者等)やシステム、インフラ機器を横軸に並べ、縦軸を時間軸にして、付箋等を用いて流れ図を作成します。
手順2:
問題点の抽出
次に、時系列事象関連図を用いて、時系列に事象を追いながら、発生している問題点を抽出していきます。抽出した問題点には通し番号を振ります。
手順3:
背後要因の探索
なぜ、問題が起きたのか最重要な問題から背後要因を探ります。最重要な問題に関連づく問題点を階層的に並べていきます。背後要因の抽出は、原因ではなく、事象(最終的に発生した障害事象)から探索していきます。こうすることで、論理の飛躍を防ぐことができ、1つ1つ論理的に考えることが出来ます。また、根本原因を追究するという方法もありますが、突き詰めていくと自社、自部門で解決できない問題まで遡りますので、対策がとれる範囲の追求までに留めておくことが賢明です。
手順4:
考えられる対策案の列挙
問題点やその背後要因について、具体的な改善案を列挙します。
対策を考える上では、様々な方法がありますが、システム保守に限って言えば以下の手順で考えると容易です。
1 やめる(排除)
2 出来ないようにする、置き換える、自動化する(代替化)
3 わかりやすくする、やりやすくする(容易化)
4 予測させる、信頼性を優先させる(予測)
5 気づかせる、自動的に検査する(検知)
6 冗長化する、備える(影響緩和)
手順5:
実施する対策の決定
実行可能性を基に対策案を評価し、実施する対策を選ぶ
対策案の決定には、以下の4つの評価項目から実行可能性を評価し決定します。
・効果:対策でどの程度効果があげられるか
・時間:実行効果がすぐに現れるか
・コスト:対策にどれだけのコストが掛けられるか
・労力:対策を行う人材の確保ができるか
評価項目ごとに点数化して優先させる対策を抽出します。
対策は、実行可能性と現在の状況に合わせて多面的に実施したほうが効果が得られやすく、また、短期的な対策と長期的な対策とを分け段階的に実施していくことで、理解が得られやすくなります。(図1 参考
手順6:
対策の実施
対策を実践していく上で、誰が、いつまでに、どのようにして実施するかを決め、的確に実施されたかどうかを確認します。
手順7:
実施した対策の効果の評価
実施した対策に効果があったのか、1か月後、3か月後・・・等のタイミングで評価を行い、対策が定着しているか、期待された効果が現れているか、他の問題が発生していないか、現場へのアンケートや集計されたインシデント推移等を用いて評価します。




図1 実施する対策の決定



 今回取り上げた手法を用いることで、変更管理プロセスの改善を進歩させていくことが現実的な解となるのではないでしょうか。


 事業部の要請で短納期が当たり前の状況にある中、可能な限り人手での作業を機械化・自動化して、その効率化できた時間をこのようなプロセスの改善分析に時間を割くことが今後のIT部門には求められます。現在は、リリース作業や移行作業といった従来なら人が夜間や休日に張り付いて実施している作業を自動化するようなサービスも提供されております。高品質と短納期を実現するためには必要な機能ではないでしょうか。



0 件のコメント:

コメントを投稿