相関関係と因果関係の違いとは?

データ分析

「データ分析」「データサイエンティスト」「データ至上主義」

インターネットの普及により、一層大きな価値を持つようになったデータ。一方で、データを盲信してしまうことは致命的なミスに繋がる場合もあります。簡単にデータを得られるようになった現代において求められるのは、データをとる手法以上に「データを正しく扱うこと」ではないでしょうか。

データの盲目性から逃れるために、「因果と相関」の観点から考えていきます。

ツトム先輩
ツトム先輩

今日は、データについて考えてみよか。

出〜た。頭使いそうな。

マナブ
マナブ
ツトム先輩
ツトム先輩

まあ、数字とか出さずに分かりやすく解説するから。

頼んますよ。

マナブ
マナブ
ツトム先輩
ツトム先輩

じゃあ、マナブ。「冬と言えば・・・」で思い浮かぶ食べ物、なんかある?

冬ですか。
うーん、なんでしょう・・・。トナカイ、ですかね。

マナブ
マナブ
ツトム先輩
ツトム先輩

いやトナカイ食うんかいな。

すみません。まだ食べたことです。

マナブ
マナブ
ツトム先輩
ツトム先輩

まだって何やねん。
食べ物やゆーてるやろ💢

トナカイが思い浮かんだもんで。

じゃあ、カニで。

マナブ
マナブ
ツトム先輩
ツトム先輩

それでええわ。まあ、カニは冬のイメージあるな。

たしカニ。

マナブ
マナブ
ツトム先輩
ツトム先輩

・・・

因果と相関

夏になると、アイスが売れる。
これは、夏の暑さが要因となって冷たいアイスを食べたくなる人が増えるからと推測できます。ここでは、「気温の高さ」と「アイス」の間に相関関係があると言えます。

相関関係とは
一方が変化すれば、他方も変化するような関係。
 
もし自分がアイス屋さんを経営している場合、気温の変化に伴ってアイスの販売数を決めることで、不良在庫を減らすことができるかもしれません。
 
どの時期にどれだけ材料を購入すれば良いのか、売上はどれだけ見込めるか。物事の相関関係がわかれば、一方のデータを予測するのに役立てることができます。
 
一方で、「相関は必ずしも因果を意味しない」ということも覚えておく必要があります。
 
夏に売れるものの例として、水着で考えてみましょう。
 
今年の夏は、たまたま海水浴エリアが格安で旅行できたとします。
すると、それに伴い水着の売上も上がりました。
 
都内でアイス屋さんを経営しているAさんは、水着が売れていることを聞きつけアイスの出荷量をいつもの2倍にしました。この経営判断は、果たして正しいでしょうか?
 
水着もアイスも、どちらも夏に売れる商品です。
そのため、水着とアイスの売上グラフには一定の相関が見られるかもしれません。
 
しかし、データの要因となるものはその他にもたくさん存在するため、必ずしも常に相関が見られるわけではありません。
 
この2つは、相関はあっても因果はないということです。
 
 
因果関係とは
二つ以上のものの間に原因と結果の関係があること。
 
 
水着が売れたことで、アイスが売れた。
これが成り立つ場合、2つには因果の関係があると言えます。
 

データを見るときに陥ってしまうミスとして、相関を因果と勘違いしてしまうということが挙げられます。

アイスの売上を伸ばすために、水着をたくさん売ろうとする人などいません。それは、2つに因果関係がないからです。

私たちがデータを見るときに必要な視点は、「相関関係か因果関係か」を正しく見極めることです。

 

ツトム先輩
ツトム先輩

相関か因果か。
データを見るときに必要なファーストステップやな。

僕が話し出すとキョウコちゃんが嫌な顔をする。

というのは相関でしょうか。

マナブ
マナブ
ツトム先輩
ツトム先輩

それは因果やな。