度数分布表
度数分布表の概念
度数分布表は、統計学で用いられる手法の一つです。 特定の変数(例:性別、年齢層、製品カテゴリなど)に対する各値の出現回数を整理した表です。 この表を用いれば、例えば、ある調査対象群において「男性と女性がそれぞれ何人いるのか」、「特定の年齢層がどれだけ多いのか」を直感的に理解することができます。
絶対頻度と相対頻度
- 絶対頻度: 各カテゴリで観測された具体的な回数。例えば、男性が100人、女性が90人いた場合、その数(100と90)が絶対頻度になります。
- 相対頻度: 絶対頻度を全体のサンプル数で割ったもの。通常はパーセンテージで表示され、各カテゴリが全体に占める比率を示します。
性別による度数分布表の例
性別 | 絶対頻度 | 相対頻度 (%) |
---|---|---|
男性 | 30 | 60% |
女性 | 20 | 40% |
この表から、調査対象の100人のうち、60人が男性で40人が女性であることが分かります。
度数分布表の用途
度数分布表は、データの初期分析フェーズで特に重要です。 データの傾向やパターンを明らかにし、その後の分析方針を立てるための基礎情報を提供します。
年齢層による度数分布表の例
年齢層 | 絶対頻度 | 相対頻度 (%) |
---|---|---|
18-24 | 10 | 20% |
25-34 | 20 | 40% |
35-44 | 15 | 30% |
45以上 | 5 | 10% |
全体 | 50 | 100% |
この表から、調査対象の100人のうち、最も多い年齢層は25-34歳で、その次は35-44歳であることが分かります。
有効パーセンテージ
特に調査データなどで、「無回答」や「無効な回答」がある場合、それを除外した上で相対頻度を計算すると、より精度の高い解釈が可能になります。このように計算された相対頻度を「有効パーセンテージ」と称します。
有効パーセンテージの計算方法 有効な回答の数(例:100人)を、総有効回答数(例:全体の200人から無効な10人を除いた190人)で割ります。その後、100を掛けてパーセンテージ形式で表示します。
調査データの度数分布表の例
カテゴリ | 絶対頻度 | 相対頻度 | 有効パーセンテージ |
---|---|---|---|
男性 | 100 | 50% | 52.63% |
女性 | 90 | 45% | 47.37% |
無回答 | 10 | 5% | – |
計算例 - 総サンプル数:200人 - 無回答数:10人 - 総有効回答数:190人(200人 - 10人)
男性の有効パーセンテージ = (100 / 190) * 100 = 52.63% 女性の有効パーセンテージ = (90 / 190) * 100 = 47.37%
その他
クロス集計
クロス集計 (交差表) は、2つ以上のカテゴリ変数(例:性別、年齢層)の関係を調査するための多変量解析手法です。 この手法を用いることで、複数の変数間の関係やパターンを一度に把握することができます。 例えば、ある製品の購入者層が性別や年齢層にどう分布しているのかを同時に分析することが可能です。
20代 | 30代 | 40代 | 合計 | |
---|---|---|---|---|
男性 | 20 | 40 | 30 | 90 |
女性 | 25 | 30 | 40 | 95 |
合計 | 45 | 70 | 70 | 185 |
この表から以下のような情報を得ることができます:
- 男性購入者は90人、女性購入者は95人。
- 30代と40代は同じく70人で最も多く、次に20代が45人。
- 男性は30代が最も多く、次に40代、最後に20代。
- 女性は40代が最も多く、次に20代、最後に30代。
このように、クロス集計は複数の変数に対する絶対頻度や相対頻度、有効パーセンテージなどを一覧でき、多角的な解析が可能です。
クロス集計における相対頻度
相対頻度には以下の3種類があります
- 全体の相対頻度: そのセルの頻度が全体の合計(ここでは185人)に占める割合です。
- 列の相対頻度: そのセルの頻度がその列の合計に占める割合です。
- 行の相対頻度: そのセルの頻度がその行の合計に占める割合です。
以下に各種相対頻度を加えたクロス集計を示します。
全体の相対頻度: 各セルの数値(例:男性かつ20代が20人)を全体の数(185人)で割ってパーセンテージで表示します。
20代 | 30代 | 40代 | 合計 | |
---|---|---|---|---|
男性 | 20 (11%) | 40 (22%) | 30 (16%) | 90 (49%) |
女性 | 25 (14%) | 30 (16%) | 40 (22%) | 95 (51%) |
合計 | 45 (24%) | 70 (38%) | 70 (38%) | 185 (100%) |
列の相対頻度: 各セルの数値(例:男性かつ20代が20人)をその列の合計(例:20代の合計45人)で割ってパーセンテージで表示します。
20代 | 30代 | 40代 | 合計 | |
---|---|---|---|---|
男性 | 20 (44%) | 40 (57%) | 30 (43%) | 90 (49%) |
女性 | 25 (56%) | 30 (43%) | 40 (57%) | 95 (51%) |
合計 | 45 (100%) | 70 (100%) | 70 (100%) | 185 (100%) |
行の相対頻度: 各セルの数値(例:男性かつ20代が20人)をその行の合計(例:男性の合計90人)で割ってパーセンテージで表示します。
20代 | 30代 | 40代 | 合計 | |
---|---|---|---|---|
男性 | 20 (22%) | 40 (44%) | 30 (33%) | 90 (100%) |
女性 | 25 (26%) | 30 (32%) | 40 (42%) | 95 (100%) |
合計 | 45 (24%) | 70 (38%) | 70 (38%) | 185 (100%) |