「システム思考」「因果推論」を活用する
システム思考を活用する
データを分析しても「当たり前のこと」しか出てこないことはありませんか。
「仮説なく、とりあえず原因究明する」「たぶんこういうことだと思うと仮説をたて、この質問を入れよう」「たぶんこの仮説はこういう傾向が出るはずだよ、だからこれとこれとこの3つも考え分析しよう」のように原因結果を追求しないのでは?
私たちはシステム思考をあまりしていないように感じます。左の図が目に入った時、あなたは何を感じますか、どんなことを考えますか?
” 何か、右上がりだ”、
”いや、左下がりだ”、
”ばらばらに散らばっているだけだ”、
”点の大きさが違うんじゃない”
何も気にしないで、すっとその場を離れる人、
”気にしている時間はないな”とつぶやく人。
でも、タスクに取り組む必要がでました。
タスクは、この図から私たちは何某かの傾向を決めること。タスクに答えるため、点の集合の分析を始めます。そして、タスクチームにどういう視点で分析するかのアイデアに関する意見を聞くことを始めました。問題を解決するため、「見ざる言わざる聞かざる」はしないアクションをとることを決めました。
では、どんな思考で進めますか?
システム思考とは
システム思考は、問題解決や改善のために、全体像を把握し、関係する要素を分析することから始めます。システム思考の手法を活用することで、問題解決の効率化や、より良い意思決定が可能になります。
そこで、システム思考は、①「・・・・・・はどんな・・・・・・で構成されているのか?」「その構成は要素としてどんな関係があるのか?」「その構成に影響を与える外部要因は何か?」「その要因に対して私たちは何ができるのか?」「その要因へのアクションがもたらす結果や副作用(心理的安全性も含めて)は何か?」などを分析、評価し、効果的で納得しやすい解決策に結びつけます。
もちろん、システム思考は簡単なことではありません。システムは複雑で不確実で変化しやすいもので、システム思考をするためには、多角的な視点、情報、知識、経験などが必要です。
思考方法「システム思考」と「ロジカル思考」の違いと強み
ロジカル思考は、
①問題を要素に分けて原因を分析します。
②特徴は、要素分解にあるといえます。
要素を分解することによって単位を小さくし、それぞれの要素の理解を深めることができます。
でもロジカル思考は、静的であることが前提の思考法であり、時間変化が考慮されていません。
システム思考は、
①要素間のつながりや相互作用を分析する。
②時系列の変化を踏まえ、全体の振る舞いを理解するための思考法です。
③基本的な構造は因果のつながりで、「風が吹けば桶屋が儲かる。」、
③-1そして因果のつながりは元にもどってくる、これがループです。
④そしてループは時間の経過で変化していきます。
どちらも強みがあります。目的に応じて使い分けます。
では、④時系列変化パターンについて、暑い環境のループを考えてみましょう、下の図を見てください。
A 外の環境の気温が上がる。高いほど、–>暑さを感じる。–> B 暑さを感じるほど–>汗が出る。–>C汗をかくほど暑さは–>和らぐ。
注目すべき「因果推論」
統計学において、注目すべきは「因果推論」です、因果推論は、データに「因果関係」があるかどうかを推定する手法です。因果関係は、「原因とその原因が起こす結果」の関係です。 この分析が注目されている理由は、因果推論の結果が意思決定に大きく関わって、影響する点にあります。
推論(reasoning)についての説明
ここで推論(reasoning)について説明します。
前提や証拠から規則、過去の事例、メンタルモデルを収集します。メンタルモデルは過去の経験のこと。この規則、過去事例、メンタルモデルに基づき、結論または新しい情報を導く思考のプロセスのことを推論と呼び、2つの推論は演繹的と帰納的がその代表です。
推論のタイプは、演繹推論(デザイン思考)と帰納推論(積上げ思考)に分れ、ビジネス現場における因果推論は、業務の品質や効率を改善し効果を高める、手法は、PDCA(Plan、Do、Check、Action)のフレームワークです。これは、何か業務改善に取り組む時は、まず目的を決め、目的到達の施策を設計し(Plan)、その目的到達の施策を実行し(Do)、施策の結果を評価し(Check)、その評価に基づき改善案(Action)を考えてまた行動する。この繰り返しでスパイルアップする、これは仕組みです。
因果推論は、PDCAサイクルの中では「評価」のプロセスで役立ちます。例えば、生産性向上では、計画した施策をもれなく確実に実行した。では、「施策実施(原因)によって、生産性向上(結果)がどれぐらいだったのか」を評価します。計画通りの成果となれば、次の新しい生産性向上施策の設計をし、実行します。
推定の手法に因果推論を使う
ここで考えてみてください。今月の生産性の向上(結果)は、本当に向上施策の実施(原因)から出たのか? もし、施策実行が結果の原因でなければ、次の施策計画、実行をすることはムダになる虞が大です。それを見極めるために、「“生産性向上施策"が“生産性向上”に対してどれくらいの効果をもたらすのか」を推定する必要があります。この推定の手法が因果推論です。
このように、経験と勘と度胸ではなく科学的に適切な評価を行うことが、適切な改善活動につながります。これは製造部門だけでなく、例えば、新製品の評判を評価する、行政機関の政策を評価するなど、様々な業界の評価プロセスで使えます。また、何某かの施策を評価する時に因果推論を実施することは重要です。
ここから先は、データ分析をするとき知っておくべき「因果推論」の基礎的な考え方を説明します。
相関関係があるデータから 因果関係を推定する
「2つの変数(例変数X)において、一方が変化すればもう一方の変数(Y)も変化するような関係」があれば相関関係があるといわれる。 しかし、相関関係があっても、必ずしも因果関係があるとは言えません。そこで因果関係と相関関係、因果関係と相関関係の違い、因果関係を推定するときに注意すべき点について説明します。
因果関係と相関関係の違い
相関関係
相関関係は3つ、正の相関、無相関、負の相関があります。図で示すと、上の図1のようになります。 図1の左は、右肩上がりのグラフです。これは「一方の変数(横軸)が大きいときに、もう一方の変数(縦軸)も大きい」という関係で「正の相関」と言います。 図1の右は、右肩下がりのグラフです。これは「一方の変数が大きいときに、もう一方の変数は小さい」という関係で、「負の相関」と言います。 図1の中央は、「一方の変数が大きいときに、もう一方の変数は小さくも大きくもない」という関係で、「無相関」と言います。
相関関係の強さは「相関係数」という指標で示され、分析で相関係数は、-1から+1の間の数字を使います。相関係数が負(マイナス)のときは負の相関を示し、相関係数が正(プラス)のときは正の相関があることを示します。相関係数が0に近いほど無相関で、係数が+1または-1に近くなればなるほど、相関は強いことを示します。(式:Y=X)(Y=-X)となります。
相関関係のイメージ 、正の相関 無相関 負の相関を図1に示します。
図1·相関関係のイメージ 正の相関 無相関 負の相関
因果関係
さて、因果関係とは、「原因とそれによって生じる結果との関係」のことで、この関係は「一方が変化すればもう一方も変化するような関係」これを、相関関係といいます。つまり、因果関係と相関関係は、図2のように因果関係は相関関係に包含される関係にあります。
要するに、2つの変数の間に因果関係があることは相関関係があることです。しかし、相関関係があるからと言って、因果関係があるとは限りません。この包含図を見てください。
「因果関係がある」ために以下の条件が必要です。
①原因となる変数(変数1,2,3…….)は、結果の変数(変数1,2,3…….)よりも時間的に前の過去、古くから発生していること(時系列性があること)。
②他の外部要因の影響を受けない状態であること。
最初①の条件について、図3にイメージを示します。図3の上の因果関係では変数X(原因)から変数X(結果)に時間的な矢印が伸びています。これは時系列を表します。このときの因果の方向は「変数X(原因)→「変数Y(結果)」です。図3の下の相関関係では、変数Xと変数Yの間に時系列の関係はありません。また原因も結果もありません。だから図のX、Yに原因と結果を記入していません。相関関係は原因も結果もありません。
因果関係があるように見える関係
ここは関係に騙されないためぜひ知っておいてください。
本来、因果関係がない2つの変数が、見えない要因によって因果関係があるかのように推定してしまうことがあります。これを「疑似相関」と呼びます。そして、データ分析において、この擬似相関を因果関係とすることは、非常に危険です。
疑似相関には、いくつかの例があります。ここでは以下の3つの例を挙げて解説します。
例1:「因果の方向」が逆になっている。逆になっていないか原因、結果を決めるときには確認をすることです。すなわち、原因となる変数が、結果となる変数よりも時間的に前の、古い時に発生していない。(時系列性がない)
例2:「交絡」が起きている。 ここは大事です、次をよく読んでください。
季節は夏の真っ盛り、
「かき氷の売り上げ」と「水の事故の件数」の間に、正の相関がありました。この結果から、「かき氷の売り上げが増加する(原因)ことによって、水の事故の件数(結果)が増加する」と因果関係を推定することは正しいのか?
NOTE:アイスクリームの販売量と電気の使用量との相関にも同じような展開があるでしょう。
①因果関係を示考えてみます。もし、これが正しければ、「かき氷の販売を控える」という意思決定をしなければなりませんが、これは正しくないぞ、と直観的に理解できるで。どうも変だ、なぜを考える必要があります、②因果関係を推定する時、相関関係がある2つの変数の背後にある別の変数(原因)を考えることが必要です、この例では、「かき氷の売り上げ」と「水の事故の件数」の2つの変数に共通して影響を与える変数として考えられる変数(背後要因)には変数1、変数2、変数3、・・・・・例として、「気温」または「湿度」「風向き」も考えられます。この場合の因果関係を作ってみると、「気温(原因)が高くなる」ことによって、かき氷の売り上げ(結果)が増加する」ことと、「気温(原因)が高くなることによって、水の事故の件数(結果)が増加する」ことの2つの因果関係を表しています。つまり、「かき氷の売り上げ」と「水の事故の件数」には因果関係はないから、この関係は疑似相関と結論できます。そして、「かき氷の売り上げ」と「水の事故の件数」の2つの変数は、「気温」という外部要因の影響を受け、交絡が起きている、外部要因の変数の気温は、「交絡因子」と呼ばれ、「気温」という交絡因子によって、「かき氷の売り上げ」と「水の事故の件数」は疑似相関で2つの変数に交絡が起きている状態だ、ということができます。
例3:「選択バイアス」が生じている。
「選択バイアス」が生じているケースです。
試験科目は「英語」と「数学」で、各200点満点とします。試験の合否は2科目の総合得点で判定、合格最低点は260点でした。 この試験の合格データを分析すると、「英語の点数」と「数学の点数」に「負の相関」がありました。この分析結果から「英語の点数(原因)が高くなることによって、数学の点数(結果)が低くなる」という因果関係を推定するのは正しいのか?
この場合の因果関係を示すと、「英語を勉強すると数学の点数が下がるので、英語は勉強しない方が良い」という意思決定となります。これは直観的に正しくないことがわかります。
では、なぜ合格データの「英語の点数」と「数学の点数」に負の相関があるのでしょうか。ここで、受験者全体のデータで「英語の点数」と「数学の点数」の散布図を示してみました。すると2つの変数の間に相関は見られず、無相関でした。 そこで、合格と不合格を分けた散布図を作りました。合格ライン(総合得点が260点)を直線で示し、合格ラインは、例えば、「x軸(英語の点数)が200でy軸(数学の点数)が60のとき」、「x軸が60でy軸が200のとき」などを示しました。 散布図の中の合格データを見ると、合格者のデータは右肩下がりの負の相関があるように見えました。受験者全体のデータでは英語の点数と数学の点数に相関関係はないにもかかわらず、合格者のデータだけに絞って分析すると負の相関があるように見える。
この例のように、分析データをするときに入り込むデータの偏り(歪)を「選択バイアス」といいます。
この因果関係を図に示します。「英語の点数」と「数学の点数」は2つとも「総合得点」に影響しています。因果関係ありです。
例では「英語の点数」と「数学の点数」の因果関係を「総合得点」から合格ラインで絞ったことにより、選択バイアスが生じました。このように、因果関係を調整するときに入り込む選択歪、選択偏り(バイアス)のこと。
補足:
選択バイアスは、情報を得る時にデータの一部のみを取得する、そして分析した結果に歪み、偏り (バイアス)が出ることをさします. データ分析において、サンプル選択によって偏りが生じる事例はある商品の評価を調べる場合、その商品について良い評価を持っている人が回答する確率が高くなることがあるとその商品について悪い評価を持っている人の意見が反映されないため、偏った結果になってしまう可能性があります。
まとめ
疑似相関を確認すること
ここまで、因果関係と相関関係の違いや、疑似相関について説明しました。実際にデータ分析を行うときは、分析している変数同士は疑似相関状態にないかを慎重に確認する必要があります。 Pythonを使い散布図を描き、相関係数を求めることで、データの因果関係の整理ができます。Google Colaboratoryを試みてください。
システム思考は問題を解決すること
問題解決には、今起きている出来事(結果)とその”なぜ”結果を起こしたか(原因)を突き止めることです。事故調査、災害調査の原因探求にも同じシステム思考の理論が使えます。
Design Safety System