ビジネス統計スペシャリストへの道!エクセル分析スペシャリスト体験記1「用語を理解する(1章~4章)」

その他

こんにちは、blueです。

今回私は仮説検定などの統計手法を仕事で活用する必要性に駆られ、基礎から学び直す決意を固めました。

この記事では、統計用語の意味を明快に解説し資格取得までに導く情報をお届けします。統計学への第一歩を踏み出すあなたにとって、貴重な参考となることでしょう。一緒に学んでいきましょう!

エクセルを使った統計において仮説検定を勉強したい方は以下がお勧めです。エクセルの「データ分析」アドインを使用するので難しい計算式などはでてきませんし、資格取得も可能です。平易な言葉が使われているので数学が苦手な人でも理解しやすい書籍です。

エクセルを使った統計について一から勉強したい方は以下がお勧めです。平均や中央値など統計で用いる基本的な項目を平易な言葉でわかりやすく説明してくれています。仮説検定を勉強する前に読んでおくとよい書籍です。

Excelを使った統計について一通り勉強したい方は以下がお勧めです。やや数学的な計算が入った説明がありますが最低限の数式で統計を使いこなせるようにしてくださっています。

スポンサーリンク

1章 値の種類

量的データと質的データ

  • 量的データ・・・加減乗除できる、かつ意味がある。平均値に意味があるもの
  • 質的データ・・・文字列数値に置き換えしたもの

母集団と標本

  • 母集団・・・真に知りたい全データ
  • 標本・・・一部抜き取ったデータ

記述統計と推測統計

  • 推測統計・・・母集団の解析
  • 記述統計・・・標本データの解析

標準誤差と標準偏差

  • 標準誤差・・・母集団を考えた時の平均値の推定精度。データ個数やバラツキに影響を受ける
  • 標準偏差・・・平均値からのばらつき平均値からの距離の程度

2章 基本統計量

質的変数のまとめ方

  • 度数表・・・各選択肢の出現頻度を確認する。行列でクロス集計表ともいう。ピボットテーブルによる集計が便利
  • グラフ・・・結果を一目でわかるようにする。棒グラフや円グラフなど
  • 度数分布表・・・連続した値を区切って質的データに変換し、区間ごとの出現頻度でまとめた表
  • ヒストグラム・・・度数分布表をグラフにしたもの。Excelの場合グラフから作成できるが区間は指定できない。データ分析から作成すると区間の指定が可能(あらかじめ区間を記載しておく必要がある)。

量的変数のまとめ方

  • 基本統計量・・・量的データの把握方法。数値で全体像を把握する
    • データの中心を表す統計量
      • 平均値・・・値をすべて合計し、データの個数で割ったもの
      • 中央値・・・データを大きい順(もしくは小さい順)から並べた時にちょうど真ん中に来る値
      • 最頻値・・・もっとも出現頻度が多い値
    • データのゆがみや尖りを表す統計量
      • 歪度・・・分布が左右対称かを表す統計量。0で左右対称 <0で左寄り
      • 尖度・・・分布のとがり具合を表す統計量。0で正規分布 >0で尖っている
  • 時系列データは基本折れ線グラフでまとめる

3章 基本統計量2

データのばらつき

  • 分散・・・平均値との差を2乗して平均をとったもの
  • 標準偏差・・・平均値との差(偏差)の程度を表したもの分散の√をとったもの。±1σ内に68%のものが存在する
  • 変動係数・・・標準偏差は平均値の大きさによって大きく異なる。標準偏差を平均値で割ることで平均値の異なるもの同士でも比較できるようになる→変動係数=標準偏差/平均

標準偏差と不標準偏差

  • 標準偏差・・・母集団(対象データを全体として見る)の標準偏差のこと。STDEV.P(データ範囲)で出す
  • 不変標準偏差・・・標本から母集団の標準偏差を見積もったものSTDEV.S(データ範囲)で出す。データの個数-1で割っている(データの個数から1引く方が誤差が大きくなることから)

標準誤差

  • 標準誤差・・・一部のデータで計算した母集団の平均値の精度。標本から出した平均値が母集団の真の平均値からどれくらいの幅にあるかを示す

標準化と偏差値

  • 標準化・・・平均値を0に標準偏差を1としたもの。この方法で単位が異なるもの同士でも比較できるようになる。STANDARIZE(対象とする値、平均値、標準偏差)でだせる
  • 偏差値・・・標準化した後に10倍して50を足す。平均値が50になる。+1σが60、+2σが70になる

4章 2変量のデータのまとめ方

因果関係と相関関係

  • 因果関係・・・あることが別のことを引き起こす関係。原因系変数をx、結果系変数をyと置くことでx→yとかく
  • 相関関係・・・2つのことが一緒に起こる関係x1⇔x2と書く

有意確率(p値)

  • 有意統計学的に差や相関があるといえること
  • 有意確率差や相関が“たまたま”である確率
  • 有意水準”たまたま”であるリスクの上限値。これより確率が下回れば有意差があるといえる

今回のまとめ

今回は「ビジネス統計スペシャリスト・エクセル分析スペシャリスト」の1章から4章までの用語をまとめました。実践での計算は大事ですが、まずは用語について説明できないと意味がないと考えていますのでお付き合いいただければ幸いです。
次回は5章から10章の用語のまとめをします。

エクセルを使った統計において仮説検定を勉強したい方は以下がお勧めです。エクセルの「データ分析」アドインを使用するので難しい計算式などはでてきませんし、資格取得も可能です。平易な言葉が使われているので数学が苦手な人でも理解しやすい書籍です。

エクセルを使った統計について一から勉強したい方は以下がお勧めです。平均や中央値など統計で用いる基本的な項目を平易な言葉でわかりやすく説明してくれています。仮説検定を勉強する前に読んでおくとよい書籍です。

Excelを使った統計について一通り勉強したい方は以下がお勧めです。やや数学的な計算が入った説明がありますが最低限の数式で統計を使いこなせるようにしてくださっています。

コメント

タイトルとURLをコピーしました