数値変換による基本統計量の計算

昔々、コンピューターが今のように普及していない時代、基本統計量をできる限り簡単に計算するため、データの桁数をできる限り最小化していました。これを数値変換による基本統計量の計算といいます。次の簡単な例で計算方法を説明します。

データ1:205 405 505 605 805

データ1の平均値、平方和、分散を計算してみましょう。

エクセルを使用すれば上記の計算はミスなく簡単にできます。しかし、QC検定の試験中はパソコンを持ち込むことができませんので、手計算しなければなりません。特に平方和の計算ですが、桁数が多いので時間がかかりますし、ミスをするかもしれません。そんなとき、数値変換を使って桁数の少ないデータにしてから計算すると楽に、また、ミスも極力避けることができます。数値変換するために元の各データに次の式を適用してみます。

これはどういうことかというと、各データ(スモールエックスアイ)から5を引き、100で割った数字を(ラージエックスアイ)に置き換えなさいという意味です。データ1を使って次の表で説明します。

1 205 (205-5)÷100=2
2 405 (405-5)÷100=4
3 505 (505-5)÷100=5
4 605 (605-5)÷100=6
5 805 (805-5)÷100=8
合計 2525 25
平均値 =505 =5

上記の式を使ってデータを変換すると、は2、4、5、6、8というように桁数が1の位の数字になりました。これで平均値を計算すると5になります。暗算でも算出できます。5はの平均値ですので、の平均値にするため、数値変換に使用した式を使って戻してあげます。数値変換に使用した式をで解くと次の式が得られます。

これは、データを変換した式ですが、平均値にも適用できます。実際には、次の式になります。

 =5を代入すると

 となり、数値変換する前に計算した平均値と一致します。

次に平方和を計算します。平方和は次の式で表すことができます(平方和・分散・標準偏差・変動係数参照)。

とはの平方和のことです。つまり、数値変換後の平方和のことをいいます。以下の表での合計との合計を計算します。合計を計算する際、以下のような表を作成すると整理しやすく、式で書くよりもミスをなくすことができますので、是非参考にしてください。

1 2 4
2 4 16
3 5 25
4 6 36
5 8 64
合計 25 145

上記表より、

となりました。平方和の式に代入すると

 となります。

次にの平方和に戻すため、次の式を適用します。

 代入すると

 となり、変換しないで計算した平方和と一致します。分散、標準偏差、変動係数については、従来通りの計算で算出できます。なぜ、変換後の平方和を100の2乗倍するのかというと変換後のデータは変換前のデータを100で割っており、平方和はデータを2乗して算出しますので(実際には偏差を2乗して算出しますので)、割った数の2乗でもどさなければならないからです。では、返還前にデータから引いた5はどうなるの?という疑問があると思います。平方和はばらつきを表す基本統計量ですので、元のデータに何を足そうが、引こうが、平方和には影響ありません。もっと、ちゃんとした理論がありますが、難しくなってしまいますので、このページでは割愛させていただきます。

以上のように、元のデータに同じ数を足したり(+)、引いたり(-)、掛けたり(×)、割ったり(÷)してもよく、うまく活用すれば、計算が非常に楽になりますし、ミスも防ぐことができますので、是非やり方を覚えてください。絶対に返還前の平均値、平方和に戻すことを忘れないでください。