【初心者統計学入門】統計学に関する用語についてできる限りわかりやすく説明します3(回帰分析)

その他

こんにちは、blueです。

前回は「推測統計」についての説明をしました。

前回の記事はこちら

回帰分析に対しては

・回帰って何か難しそうな言葉
・重回帰なんてすごく難しい解析方法でしょ?

と思われる方も多いと思います。

ただ処理自体はExcelでもやってくれるのでそれほど難しいものではありません。

その為今回は統計学の「回帰分析」についてできる限りわかりやすく説明しようと思います。

この記事を読めば

  • 回帰分析には「単回帰分析」「重回帰分析」が存在する
  • 線形回帰分析はExcelで行うことが可能である
  • 重回帰分析を行う際は「多重共線性」などに注意する

ことがわかるようになります。

回帰分析には推測統計の知識も必要ですができる限り平易に書いています。是非読んでいってください。

Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。

統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。

数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。

スポンサーリンク

回帰分析とは

「データを予測した式を作ること」を回帰分析といいます(Excelによるやさしい統計解析)。

その為回帰分析は「推測統計」の中の一つの分析手法になります。

簡単に言うとグラフに対して近似の直線or曲線を想定することででデータにない部分に対して予測をする方法となります。

クリックすると拡大します

以下で各用語について説明します

回帰分析

被説明変数と1つ以上の説明変数との間にどのような関係があるのかを分析する手法
〇被説明変数(目的変数):説明したい一つの変数(y=ax+bのy)
〇説明変数:要因となりそうな1つもしくは複数の変数(y=ax+bのx)

統計学の基礎から学ぶExcelデータ分析の全知識

単回帰分析

被説明変数を一つの説明変数を使った関係式で表す手法

Excelによるやさしい統計解析

重回帰分析

被説明変数を複数の説明変数を使った関係式で表す手法

Excelによるやさしい統計解析

線形回帰分析

y=ax+bで表される関係
Excelで算出することが可能

統計学の基礎から学ぶExcelデータ分析の全知識

非線形回帰分析

y=f(x)+bで表される関係
PythonやRを使って算出する

統計学の基礎から学ぶExcelデータ分析の全知識

回帰分析において見るべき指標

重決定R2、決定係数

得られた回帰式が実際のデータをどれだけよく説明しているかを表す指標
0~1をとる。0.5~0.6を超えるとよい
データが少ないと決定係数は大きくなる。その為一般には補正R2を用いる

Excelによるやさしい統計解析

p値

帰無仮説(傾きが0=関係がない)を棄却できるかの指標
有意水準5%の時は0.05以下であればその変数は被説明変数と関係があると言える

Excelによるやさしい統計解析

傾き

y=ax+bのaにあたるもの
影響度合いがわかる

統計学の基礎から学ぶExcelデータ分析の全知識

回帰分析における注意点

回帰分析における注意点は以下です。

外れ値は削除する

外れ値が存在すると真の直線と乖離してしまう可能性がある。
⇒外れ値は削除しておくこと

統計学の基礎から学ぶExcelデータ分析の全知識

多重共線性を考慮する

(重回帰分析の際)変数同士の相関が存在する(多重共線性)と傾きが決まらない
⇒p値があがり、決定係数があがる

統計学の基礎から学ぶExcelデータ分析の全知識

説明変数を入れすぎない

説明変数を入れれば入れるほど決定係数は高くなるが説明しにくくなる。
多重共線性の問題も起こりやすくなるためできる限りシンプルにすること

統計学の基礎から学ぶExcelデータ分析の全知識

今回のまとめ

今回は推測統計の中の「回帰分析」について説明しました。

  • 回帰分析には「単回帰分析」「重回帰分析」が存在する
  • 線形回帰分析はExcelで行うことが可能である
  • 重回帰分析を行う際は「多重共線性」などに注意する

回帰分析にも推測統計の知識は必要になりますが、簡単なものはExcelでも行うことができます。

次回は実際にExcelを使った分析方法について説明します。

Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。

統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。

数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。

コメント

タイトルとURLをコピーしました