2つのデータの関係を点で表すグラフのこと
簡単な説明
散布図ってのは、2つの数字の関係を点でバラバラっと描いたグラフだよ。
たとえば「勉強時間が長いと点数上がる?」みたいなのがパッと見でわかる!
点の並び方で「仲いいな〜」とか「関係ないじゃん」ってのがわかる感じ!
由来
散布図(英語では Scatter Plot)は、統計学やデータ分析の分野で昔から使われているグラフ形式です。18世紀後半から19世紀初頭にかけて、フランスの統計学者たちによって視覚的にデータを比較する方法として考案されました。
具体的な説明
散布図は、横軸(X軸)に1つのデータ、縦軸(Y軸)にもう1つのデータを取り、それぞれのペアに対して点を打
たとえば「勉強時間」と「テストの点数」という2つのデータがあるとします。ある生徒が3時間勉強して80点を取った場合、横軸に「3」、縦軸に「80」として点を打ちます。これを複数の生徒で行うと、勉強時間が長いほど点数が高い、といった傾向(トレンド)が見えることがあります。
散布図は、2変量データの相関分析の出発点として使われます。データ点が直線的に並ぶ場合、それは線形相関があることを示し、相関係数(ピアソンのr)などを用いて数値的に関係の強さを測定できます。例えば、相関係数rが1に近いほど強い正の相関があります。
高校生30人に「1日あたりのスマホ使用時間」と「睡眠時間」を記録してもらい、散布図にプロットすると、スマホ時間が長いと睡眠時間が短くなる傾向が見られました。この観察から「スマホの使いすぎが睡眠を減らす可能性がある」と推測できます。
例文
「このデータの散布図を作成して、身長と体重の関係性を見てみよう。」
疑問
Q: 散布図は何のために使うのですか?
A: 2つのデータの関係性(相関)を見るために使います。
Q: 散布図はどんな時に便利ですか?
A: 勉強時間と成績、広告費と売上など、何かしらの「関係性」を探りたい時に便利です。
Q: 散布図にはどんなパターンがありますか?
A: 正の相関(右上がり)、負の相関(右下がり)、相関なし(バラバラ)などがあります。
Q: 散布図を作るのに特別なソフトが必要ですか?
A: ExcelやGoogleスプレッドシートで簡単に作成できます。
Q: 相関があるからといって、因果関係があるといえますか?
A: いいえ。相関があっても、片方が原因とは限りません。
理解度を確認する問題
以下の中で、散布図に最も適した用途はどれですか?
A. 年間売上の推移を見る
B. 商品ごとの売上ランキングを表示する
C. 気温とアイスの売上の関係を見る
D. 全社員の名前を一覧表示する
正解: C. 気温とアイスの売上の関係を見る
関連論文や参考URL
“Visualizing Correlation with Scatter Plots”
この研究では、視覚的なグラフ(散布図)が人間にとって相関関係を認識しやすくするという結論に至りました。特に直線的な関係性は、散布図で明確に把握できることがわかりました。
まとめ
散布図は、2つのデータの関係を点で表すグラフです。
X軸とY軸にそれぞれのデータを取り、相関(関係性)を視覚的に確認できます。
正の相関・負の相関・相関なしのパターンがあります。


コメント