こんにちは、blueです。
前回は「推測統計」についての説明をしました。
前回の記事はこちら

回帰分析に対しては
・回帰って何か難しそうな言葉 ・重回帰なんてすごく難しい解析方法でしょ?
と思われる方も多いと思います。
ただ処理自体はExcelでもやってくれるのでそれほど難しいものではありません。
その為今回は統計学の「回帰分析」についてできる限りわかりやすく説明しようと思います。
この記事を読めば
- 回帰分析には「単回帰分析」「重回帰分析」が存在する
- 線形回帰分析はExcelで行うことが可能である
- 重回帰分析を行う際は「多重共線性」などに注意する
ことがわかるようになります。
回帰分析には推測統計の知識も必要ですができる限り平易に書いています。是非読んでいってください。
Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。
統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。
数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。
回帰分析とは
「データを予測した式を作ること」を回帰分析といいます(Excelによるやさしい統計解析)。
その為回帰分析は「推測統計」の中の一つの分析手法になります。
簡単に言うとグラフに対して近似の直線or曲線を想定することででデータにない部分に対して予測をする方法となります。

以下で各用語について説明します
被説明変数と1つ以上の説明変数との間にどのような関係があるのかを分析する手法
〇被説明変数(目的変数):説明したい一つの変数(y=ax+bのy)
〇説明変数:要因となりそうな1つもしくは複数の変数(y=ax+bのx)
統計学の基礎から学ぶExcelデータ分析の全知識
被説明変数を一つの説明変数を使った関係式で表す手法
Excelによるやさしい統計解析
被説明変数を複数の説明変数を使った関係式で表す手法
Excelによるやさしい統計解析
y=ax+bで表される関係
Excelで算出することが可能
統計学の基礎から学ぶExcelデータ分析の全知識
y=f(x)+bで表される関係
PythonやRを使って算出する
統計学の基礎から学ぶExcelデータ分析の全知識
回帰分析において見るべき指標
得られた回帰式が実際のデータをどれだけよく説明しているかを表す指標
0~1をとる。0.5~0.6を超えるとよい
データが少ないと決定係数は大きくなる。その為一般には補正R2を用いる
Excelによるやさしい統計解析
帰無仮説(傾きが0=関係がない)を棄却できるかの指標
有意水準5%の時は0.05以下であればその変数は被説明変数と関係があると言える
Excelによるやさしい統計解析
y=ax+bのaにあたるもの
影響度合いがわかる
統計学の基礎から学ぶExcelデータ分析の全知識
回帰分析における注意点
回帰分析における注意点は以下です。
外れ値は削除する
外れ値が存在すると真の直線と乖離してしまう可能性がある。
⇒外れ値は削除しておくこと
統計学の基礎から学ぶExcelデータ分析の全知識
多重共線性を考慮する
(重回帰分析の際)変数同士の相関が存在する(多重共線性)と傾きが決まらない
⇒p値があがり、決定係数があがる
統計学の基礎から学ぶExcelデータ分析の全知識
説明変数を入れすぎない
説明変数を入れれば入れるほど決定係数は高くなるが説明しにくくなる。
多重共線性の問題も起こりやすくなるためできる限りシンプルにすること
統計学の基礎から学ぶExcelデータ分析の全知識
今回のまとめ
今回は推測統計の中の「回帰分析」について説明しました。
- 回帰分析には「単回帰分析」「重回帰分析」が存在する
- 線形回帰分析はExcelで行うことが可能である
- 重回帰分析を行う際は「多重共線性」などに注意する
回帰分析にも推測統計の知識は必要になりますが、簡単なものはExcelでも行うことができます。
次回は実際にExcelを使った分析方法について説明します。
Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。
統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。
数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。
コメント