こんにちは、blueです。
今回からは統計学の用語についてできる限りわかりやすく説明しようと思います。
統計学に対しては
・ビッグデータとか大きな集団に対して分析をする為のやつでしょ? ・標本とか母集団とか出てくるけど何のこと? ・同じような用語や数式が出てきてよくわからないんだけど
と思っている方も多いのではないでしょうか?
私も最初はそうでした。統計学はとても難しい分野でこれまで使ったことのない知識を一から勉強しなくてはならないと思っていました。
ただ勉強するにつれ、統計学は日常にあふれており、自分も日々仕事などで使っていることがわかってきました。
その為今回からは統計学で出てくる用語に関して、以下の書籍やネットで学んだ情報を自分なりにまとめることにしました。
この記事を読めば
- 統計学には2つの集団が存在する
- 統計においては「記述統計」と「推測統計」の2種類が存在する
- 「推測統計」をやる前に「記述統計」を理解する必要がある
ことがわかるようになります。統計を学ぶための初心者用としてこの記事を使っていただければ幸いです。
Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。
統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。
数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。
結論
まず最初に結論です。
- 統計学には2つの集団が存在する
- 統計においては「記述統計」と「推測統計」の2種類が存在する
- 「推測統計」をやる前に「記述統計」を理解する必要がある
これらについて以下で説明していきます。
統計学では2つの集団が存在する
まず最初に統計学について説明します。
統計学とは、「現在ある集団から取得できる結果からなんとかして全体のデータの傾向や性質を理解しようという学問」のことです。
ここで現在ある集団を標本、全体のデータを母集団とも言います。
図に表すと以下のようになります。
標本はある特定の集団や一部分、母集団は非常に広いデータを示していることがわかると思います。
このように統計学においてはまず「標本」と「母集団」の存在を理解することが大事になります。
統計には「記述統計」と「推測統計」の2種類が存在する
では次に統計の手法について説明します。
まず標本についての統計は「記述統計」と言います。
「10人の試験の平均点は50点」「100人の生徒の身長の最大値は180㎝」というのは標本に対する数値なので記述統計です。
一方母集団に対する統計は「推測統計」と言います。
選挙速報で出てくる当選確実などは一部から全データを推測しているので、推測統計になります。
これらのことから「記述統計」は普通に使っているということがよくわかると思います。
ただしこれらの違いを明確に示していない書籍も多くあります。
以下に参考サイトを示します多今行っている解析は標本に対する統計なのか母集団に対する統計なのかを理解するのことが重要です。
「推測統計」をやる前に「記述統計」を理解する必要がある
記述統計は目の前の情報を扱うだけなので非常に簡単な内容です。
ただし、推測統計は見えない情報を扱う為難しくなります。
推測統計では記述統計の知識も必要になるので、先に記述統計をよく理解しておくとよいです。
その為ここでは記述統計に出てくる各用語について説明します。
なお用語の説明は各サイト、書籍をもとにしています。詳しい説明が必要な方はそちらを参考にしていただけるとより理解できると思います。
代表値(平均値、中央値、最頻値)
代表値(平均値、中央値、最頻値)とはたくさんのデータを一つの数値で表したものです。
gacco:ga031社会人のためのデータサイエンス入門
なおデータを一つの指標で表すことは困難です。ヒストグラム(後述)などを使いながらデータを見ていく必要があります。
分散・標準偏差
分散・標準偏差はデータの散らばりの程度を数値で表したものです。
グラフ
データの可視化も記述統計の一つです。上記の数値だけだとデータを見誤る可能性がある為グラフ化もセットだと思っておいた方がよいです。
統計学の基礎から学ぶExcelデータ分析の全知識
データの種類
私たちが扱うデータは大きく「質的データ」と「量的データ」に分けられます。
今回のまとめ
今回は統計の入りとして「記述統計」について詳しく説明しました。
- 統計学には2つの集団が存在する
- 統計においては「記述統計」と「推測統計」の2種類が存在する
- 「推測統計」をやる前に「記述統計」を理解する必要がある
「記述統計」を理解するだけで多くの統計処理が行えることがわかっていただけたかと思います。
ここでの知識は次の「推測統計」に非常に役に立つので、ぜひ記事を通して理解を深めていただければ幸いです。
次回は「推測統計」について説明します。
Excelは普段使っているけどデータ分析に関しては素人の方にはこちらの書籍がお勧めです。Excelの機能を使うことで最低限の数式で統計を使いこなせるようにしてくださっていて非常に読みやすいです。
統計に対して苦手意識を持っている方にはこちらの書籍がお勧めです。統計学とは?というところから丁寧に書いてくださっています。数式についても図を使いながら一つずつ説明してくださっています。
数式が大嫌い!という方にはこちらの書籍がお勧めです。この本だけでは統計解析ができるようにはなりませんが、文章や図でわかるようにすることをモットーにされているのでイメージで理解されたい方向けの書籍です。
コメント