Combining the best of systems thinking and causal inference can solve difficult problems.

System Thinking and Logical Thinkingの歴史を紹介します。

 

システム思考のもうひとつのpdfをご覧ください。

[3d-flip-book id=”4660″ ][/3d-flip-book]

ではこの先は、本論の「システム思考」と「因果推論」です。
Combining the best of systems thinking and causal inference can solve difficult problems.(「システム思考」と「因果推論」の”いいとこどり”して難問を解決)を進めます。

「システム思考」と「因果推論」の”いいとこどり”が難問を解決する。

システム思考を活用する

 データを分析しても「当たり前のこと」しか出てこないことはありませんか。
「仮説なく、とりあえず原因究明する」「たぶんこういうことだと思うと仮説をたて、この質問を入れよう」「たぶんこの仮説はこういう傾向が出るはずだよ、だからこれとこれとこの3つも考え分析しよう」のように原因結果の追求の早い段階で躓くそして次のステップに移れないのでは?

私たちはシステム思考に、あまりなれていないように感じます。さて、左の図を見て、あなたは何を感じますか、どんなことを考えましたか?
” 何か、右上がりだ”、
”いや、左下がりだ”、
”ばらばらに散らばっているだけだ”、
”点の大きさが違うんじゃない”
何も気にしないでいる人、スーッとその場眺めて離れる人、
”気にしている時間はないな”とつぶやく人。

でも、上司の指示で、タスクに取り組む必要がでました。

タスクは、私たちはこの図が持っている何某かの傾向を決めること。タスクに答えるため、点の集合の分析を始めます。そして、タスクチームにどういう視点で分析するかについて意見を聞くことから始めました。問題を解決するため、ルール「見ざる言わざる聞かざる」はしないことを決め、前向きにアクションを、決めました。

では、どんな思考で進めますか?

システム思考とは

システム思考は、問題解決や改善のために、全体像を把握し、関係する要素を分析することから始めます。システム思考の手法を活用することで、問題解決の効率化、より良い意思決定が可能になります。

そこで、システム思考は、①「・・・・・・はどんな・・・・・・で構成されているのか?」「その構成は要素としてどんな関係があるのか?」「その構成に影響を与える外部要因は何か?」「その要因に対して私たちは何ができるのか?」「その要因へのアクションがもたらす結果や副作用(心理的安全性も含めて)は何か?」などを分析、評価し、効果的で納得しやすい解決策に結びつけます。

もちろん、システム思考は簡単ではありません。システムは複雑で不確実で変化しやすいもので、システム思考をするためには、多角的な視点、情報、知識、経験などが必要です。

「システム思考」と「ロジカル思考」の違いと強み

ロジカル思考は
①問題を要素に分けて原因を分析します。
②分析の
特徴は、要素分解にあるといえます(因数分解って覚えているでしょう)。
要素を分解することによって単位を小さくし、それぞれの要素の理解を深めることができます。
ロジカル思考は静的で時間変化を考慮しない思考法です。(時間軸は分析軸には入れません、入っていません)。

 

システム思考は、
①要素間のつながりや相互作用を分析する。
②時系列の変化を踏まえ、全体の振る舞いを理解するための思考法です。
③基本的な構造は因果のつながりで、「風が吹けば桶屋が儲かる。」、
③-1そして因果のつながりは元にもどってくるループです。
④ループは時間の経過で変化していきます。

ロジカル思考も、システム思考のどちらも強みがあります。目的に応じて使い分けます。

では、

④時系列変化パターンについて、暑い環境のループを考えてみましょう、下の図を見てください。

A 気温が上がる。高いほど、–>暑さを感じる。–> B 暑さを感じるほど–>汗が出る。–>C汗をかけば暑さは–>和らぐ。

図 因果関係(上)と相関関係(下)

注目すべき「因果推論」

統計学の注目すべきは「因果推論」です、因果推論は、データに「因果関係」があるかどうかを推定(あることをもとにしてこうだろうと判断する)する手法です。因果関係(原因>結果(原因)>結果(原因)ループ=「原因と原因が起こす結果」の関係です。 この分析が注目されている理由は、因果推論の結果が意思決定に大きく関わって、判断に影響する点にあります。

 推論(reasoning)とは、説明
 前提や証拠から規則、過去の事例、出来事、メンタルモデルを収集します。メンタルモデルは過去の経験。この規則、過去事例、出来事、事象、メンタルモデルに基づき、収集した推定結論から新しい情報を導き、結論を出す思考のプロセスのことを推論と呼び、2つの推論は演繹的と帰納的がその代表です。

「ちょっと脱線:物事を推し量ることが推理、その推理に基づく理論が推論推定は推し量って定める数値など」。

 推論のタイプは、演繹推論(デザイン思考:山の頂上から裾野を見る。草取りは機械化:欧米発想)と帰納推論(積上げ思考:河原の石を積み球を見る。草取りは人手:日本的、アジア的)。

ビジネス現場における因果推論は、品質や生産性、効率の改善とすることが多く、手法はPDCA(Plan、Do、Check、Action)フレームワークです。業務改善に取り組む時は、まず目的を決め、目的到達の施策を設計(Plan)、的到達の施策を実行(Do)、施策の結果を評価(Check)、評価に基づき改善案(Action)を考えてまた行動する。PDCAの繰り返しでスパイルアップする。スパイルアップが自動的に動き続けるこれが仕組み。

 因果推論は、PDCAサイクルの中の「評価」プロセスで、例えば、生産性向上では、計画した施策をもれなく確実に実行した。そして「施策実施(原因)によって、生産性向上(結果)が全体で%向上した。そして項目ごとの%がデータで出ている。計画通りの成果出ないときは個別のWorst 3に改善を加え 、次の新しい生産性向上施策の設計をし実行します。

推定に因果推論を使う

ここで考えてみてください。
今月の生産性の向上(結果)は、本当に向上施策の実施(原因)から出たのか? もし、施策実行が結果の原因でなければ、次の施策計画、実行をすることはムダになる可能性大です。見極めるために、「“生産性向上施策"が“生産性向上”に対してどれくらいの効果をもたらすのか」を推定する必要があります。この推定手法が因果推論です。

「経験と勘と度胸」ではなく「科学的」に評価を行うと適格な改善活動につながります。製造部門だけでなく新製品の評判を評価する、行政機関の政策を評価する、様々な業務の評価プロセスで使えます。

経験と勘と度胸ではなく科学的に適切な評価のためにAIも活用すれば。今までの苦労はなくなります。AI活用には何をするも、はじめの一歩、学習をすること。2~3日使いながら学習をすればはあなたが今まで使ってきた業務時間はたったの10秒程度でアウトプットできさらに深堀出来ます。

AI Associatesがいても 、データ分析をするとき知っておくべき「因果推論」の基礎的な考え方として知っておくことを以下で説明します。

ナゼ、AIが相棒としているのに「因果推論」の説明いるの? 

Aiは時にウソ、データー抽出の偏りがあります。

あなたが知っていればチェックできます、またチェックは必要です。AI・Robotは多くの人が書いた、人が書いたら間違いはある、また偏見と偏りのあるデータ抽出(ファイル)からの応答ですから。

このデータは相関関係なのか、因果関係なのか?見極める

「2つの変数(例変数X)において、一方が変化すればもう一方の変数(Y)も変化するような関係」があれば相関関係があるといわれる。 しかし、相関関係があっても、必ずしも因果関係があるとは言えません。そこで因果関係と相関関係、因果関係と相関関係の違い、因果関係を推定するときに注意すべき点について説明します。

相関関係と因果関係の違いは、なに?

相関関係

相関関係は3つ、正の相関、無相関、負の相関があります。図で示すと、上の図1のようになります。 図1の左は、右肩上がりのグラフです。これは「一方の変数(横軸)が大きいときに、もう一方の変数(縦軸)も大きい」という関係で「正の相関」。 図1の右は、右肩下がりのグラフで「一方の変数が大きいときに、もう一方の変数は小さい」という関係「負の相関」と言います。 図1の中央は、「一方の変数が大きいときに、もう一方の変数は小さくも大きくもない」関係で「無相関」と呼びます。

相関関係の強さは「相関係数」という指標で示され、相関係数は-1から+1の間の数字を分析に使います。相関係数が負(マイナス)のときは負の相関を示し、相関係数が正(プラス)のときは正の相関があることを示します。相関係数が0に近いほど無相関で、係数が+1または-1に近くなればなるほど、強い相関を示します。(式:Y=X)(Y=-X)となります。
相関関係のイメージ 、正の相関  無相関  負の相関を図1に示します。 

図1·相関関係のイメージ 正の相関  無相関  負の相関 

因果関係

因果関係は、「原因によって生じる「結果」との関係のこと、この関係は「一方が変化すればもう一方も変化する関係」これを、相関関係といいます。つまり、因果関係は相関関係の中に図のように包含されています。

図2 因果関係と相関関係は、
図のような包含関係にある。

相関関係があるからと言って、因果関係があるとは限りません。包含図を見てください。

「因果関係がある」ために以下の条件が必要です。
①原因は、結果よりも時間的な過去に発生していること(時系列があること)。
②他の外部要因の影響を受けない状態であること。

最初①の条件について、図3にイメージを示します。図3の上の因果関係では変数X(原因)から変数X(結果)に時間の矢印が伸びています。時系列性を表します。因果の方向は「変数X(原因)→「変数Y(結果)」です。図3の下の相関関係には変数Xと変数Yの間に時系列はありません。また原因も結果もありません。X、Yに原因と結果を記入していない理由です。もう一度、相関関係はあっても原因も結果もありません。

「因果関係がある」ことを示すには、「相関関係があること」

図3.「因果関係がある」「相関関係がある」

因果関係があるように見える関係、疑似相関。

関係に騙されないためぜひ知っておいてください。

本来、因果関係がない2つの変数が、見えない要因によって因果関係があるかのように推定してしまうことがあります。これを「疑似相関」と呼びます。データ分析において、この擬似相関を因果関係とすることは、非常に危険です。

疑似相関には、いくつかの例があります。ここでは以3つの例を挙げて解説します。

例1:「因果の方向」が逆になっている。逆になっていないか、原因、結果を決めるときにはどっちが先に起きたのかを、確認をすることです。災害調査でよく起きることです。すなわち、原因となる変数が、結果となる変数よりも時間的に前の、古い時に発生していない。(時系列性がない)

災害調査は、次のどっちが先か、過去か、聞き取りインタビューで明確にしないと適切な手が打てないことがある。”階段から滑りかけ、落下し、骨折した” ”階段から落下しかけ、滑り、落下し、骨折した”

例2:「交絡」が起きている。 ここは大事です。交絡の説明をします。

本来は無関係であるはずの二つの事象(AとB)の間に、① 見かけ上の相関関係が生じる現象を指します。または ② AとBの両方に影響を与える第三の要因(交絡因子)が存在するために起こります。


質問:
季節は夏の真っ盛り、「雨が降った」(原因)「お店の来店客が減る」「かき氷の売り上げ」が増加した「水の事故の件数」が増加したの間に正の相関がありましたの報告。この後者の「かき氷の売り上げが増加する(原因)と水の事故の件数(結果)が増加する」と因果関係を推定することは正しいのでしょうか?
 note:
アイスクリームの販売量と電気の使用量との相関にも同じような展開があるでしょう。

 ①因果関係を考ます。もし、この推定が正しければ、「かき氷の販売を控える」意思決定を出なければなりません。が、システム思考に多角的な視点、情報、知識、経験などを生かして、これは正しくないと変だと考える必要があります、②因果関係を推定する時、相関関係がある2つの変数の背後にある別の変数(原因)を考えることが必要です、ここでは、「かき氷の売り上げ」と「水の事故の件数」の2つの変数に影響を与える変数(背後要因)を考える。変数1、変数2、変数3「気温」「湿度」「風向き」などを考えます。この場合の因果関係は、「「気温(原因)が高くなる」ことによって、かき氷の売り上げ(結果)が増加する」」ことと、「「気温(原因)が高くなることによって、水の事故の件数(結果)が増加する」」つまり、「かき氷の売り上げ」と「水の事故の件数」には因果関係はレアケースだから、疑似相関と結論できます。また「水の事故の件数」が増加すると「かき氷の売り上げ」が増加するか?、この関係も疑似相関と結論できます。そして、「かき氷の売り上げ」と「水の事故の件数」の2つの変数は、「気温」という外部要因の影響を受け、交絡が起きている、外部要因の変数の気温は、「交絡因子」と呼ばれ、「気温」という交絡因子によって、「かき氷の売り上げ」と「水の事故の件数」は疑似相関で2つの変数に交絡が起きているということができます。

例3:「選択バイアス」が生じている。

「選択バイアス」が生じているケースです。

試験科目は「英語」と「数学」で、各200点満点とします。試験の合否は2科目の総合得点で判定、合格最低点は260点でした。 この試験の合格データを分析すると、「英語の点数」と「数学の点数」に「負の相関」がありました。この分析結果から「英語の点数(原因)が高くなることによって、数学の点数(結果)が低くなる」という因果関係を推定するのは正しいのか?

この場合の因果関係を示すと、「英語を勉強すると数学の点数が下がるので、英語は勉強しない方が良い」という意思決定となります。これは直観的に正しくないことがわかります。
では、なぜ合格データの「英語の点数」と「数学の点数」に負の相関があるのでしょうか。ここで、受験者全体のデータで「英語の点数」と「数学の点数」の散布図を示してみました。すると2つの変数の間に相関は見られず、無相関でした。 そこで、合格と不合格を分けた散布図を作りました。合格ライン(総合得点が260点)を直線で示し、合格ラインは、例えば、「x軸(英語の点数)が200でy軸(数学の点数)が60のとき」、「x軸が60でy軸が200のとき」などを示しました。 散布図の中の合格データを見ると、合格者のデータは右肩下がりの負の相関があるように見えました。受験者全体のデータでは英語の点数と数学の点数に相関関係はないにもかかわらず、合格者のデータだけに絞って分析すると負の相関があるように見える

この例のように、分析データをするときに入り込むデータの偏り(歪)を「選択バイアス」といいます。
この因果関係を図に示します。「英語の点数」と「数学の点数」は2つとも「総合得点」に影響しています。因果関係ありです。
例では「英語の点数」と「数学の点数」の因果関係を「総合得点」から合格ラインで絞ったことにより、選択バイアスが生じました。このように、因果関係を調整するときに入り込む選択歪、選択偏り(バイアス)のこと。 

 

 

補足:
選択バイアスは、情報を得る時にデータの一部のみを取得する、そして分析した結果に歪み、偏り (バイアス)が出ることをさします. データ分析において、サンプル選択によって偏りが生じる事例はある商品の評価を調べる場合、その商品について良い評価を持っている人が回答する確率が高くなることがあるとその商品について悪い評価を持っている人の意見が反映されないため、偏った結果になってしまう可能性があります。

まとめ

疑似相関を確認すること

ここまで、因果関係と相関関係の違いや、疑似相関について説明しました。実際にデータ分析を行うときは、分析している変数同士は疑似相関状態にないかを慎重に確認する必要があります。 Pythonを使い散布図を描き、相関係数を求めることで、データの因果関係の整理ができます。Google Colaboratoryを試みてください。これからはAIをフル活用することです。

システム思考は問題を解決します

問題解決には、今起きている出来事(結果)と”なぜ”こんな結果を起こしたか(原因)を突き止めることです。多くの調査、監査、事故・災害調査の原因探求にはシステム思考の理論を使えます。理由は、ISOの各種標準のフレームワークはほぼ100%同じ体系です。

 

Let's Think to Design Safety System

Let’s Think to Design Safety System

Design Safety System

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA