XLSTATでの層化データ・サンプリング

層化データ・サンプリングのためのデータ集合

このチュートリアルで使用するデータ集合は、ある会社の従業員リストで、性別(男性/女性)と雇用形態(フルタイム/パートタイム)に関する詳細です。HRチームは、すべての従業員にインタビューすることなしに、一般的な意見の代表になるような対象に対して、職場環境についての調査を実施したいのです。彼らは、層化サンプリングを実施することにしました。

女性の従業員が46%で、男性の従業員が54% います。従業員の66%がフルタイム働いています。パートタイム従業員は、女性の方が男性よりも多いです。女性パートタイム従業員は従業員の25%で、一方、男性パートタイム従業員は9%です。

data-sampling-descriptive-statistique.png

データと結果のExcelシートは、 こちらをクリックしてダウンロードできます。

データの層化サンプリングをセットアップ

データ・サンプリング・ダイアログ・ボックスを開いてください。データ準備 – データ・サンプリング。

data-sampling-menu.png

すべての利用可能な列(employee, gender, time, strata)を含むデータを選択してください。

サンプリング・オプション無作為層化 (2)を選んでください。このオプションは、各層の比率を考慮に入れます。

我々は、インタビュー用の20人の従業員の標本を生成したいのです。したがって、標本サイズフィールドに“20” と入力します。

データ集合の最後の列を“層”として選択してください。

変数の名前が選択に含まれますから、変数ラベル・オプションをチェックします。

個体をシャッフルする必要がありませんので、シャッフル・オプションは有効にしません。

すべて設定すると OKを押します。

data-sampling-dialog-box.png

層化データ・サンプリングの結果

層化サンプリングの結果が、新しいシートに現れます。20 個の標本の表があります。サンプリングは無作為なので、厳密に同じ結果は得られません。しかし、各カテゴリで同じ比率が得られるでしょう。これは、各層に同じ数の標本を持つ結果となります:

  • 4人のフルタイム女性従業員、
  • 5人のパートタイム女性従業員、
  • 9人のフルタイム男性従業員、
  • 2人のパートタイム男性従業員。

data-sampling-result.png

下記は層化標本で計算された記述統計量です。これらの統計量を母集団で得られたものと比較できます:

  • フルタイム女性従業員22% で20%、
  • パートタイム女性従業員25%で25%、
  • フルタイム男性従業員44%で45%、
  • パートタイム男性従業員9% で10% 。

data-sampling-result-2.png

他のチュートリアルはこちら です.