数値変換による基本統計量の計算
昔々、コンピューターが今のように普及していない時代、基本統計量をできる限り簡単に計算するため、データの桁数をできる限り最小化していました。これを数値変換による基本統計量の計算といいます。次の簡単な例で計算方法を説明します。
データ1:205 405 505 605 805
データ1の平均値、平方和、分散を計算してみましょう。
エクセルを使用すれば上記の計算はミスなく簡単にできます。しかし、QC検定の試験中はパソコンを持ち込むことができませんので、手計算しなければなりません。特に平方和の計算ですが、桁数が多いので時間がかかりますし、ミスをするかもしれません。そんなとき、数値変換を使って桁数の少ないデータにしてから計算すると楽に、また、ミスも極力避けることができます。数値変換するために元の各データに次の式を適用してみます。
これはどういうことかというと、各データ(スモールエックスアイ)から5を引き、100で割った数字を
(ラージエックスアイ)に置き換えなさいという意味です。データ1を使って次の表で説明します。
![]() |
![]() |
![]() |
1 | 205 | (205-5)÷100=2 |
2 | 405 | (405-5)÷100=4 |
3 | 505 | (505-5)÷100=5 |
4 | 605 | (605-5)÷100=6 |
5 | 805 | (805-5)÷100=8 |
合計 | 2525 | 25 |
平均値 | ![]() |
![]() |
上記の式を使ってデータを変換すると、は2、4、5、6、8というように桁数が1の位の数字になりました。これで平均値を計算すると5になります。暗算でも算出できます。5は
の平均値ですので、
の平均値にするため、数値変換に使用した式を使って戻してあげます。数値変換に使用した式を
で解くと次の式が得られます。
これは、データを変換した式ですが、平均値にも適用できます。実際には、次の式になります。
=5を代入すると
となり、数値変換する前に計算した平均値と一致します。
次に平方和を計算します。平方和は次の式で表すことができます(平方和・分散・標準偏差・変動係数参照)。
とは
の平方和のことです。つまり、数値変換後の平方和のことをいいます。以下の表で
の合計と
の合計を計算します。合計を計算する際、以下のような表を作成すると整理しやすく、式で書くよりもミスをなくすことができますので、是非参考にしてください。
![]() |
![]() |
![]() |
1 | 2 | 4 |
2 | 4 | 16 |
3 | 5 | 25 |
4 | 6 | 36 |
5 | 8 | 64 |
合計 | 25 | 145 |
上記表より、
となりました。平方和の式に代入すると
となります。
次にの平方和に戻すため、次の式を適用します。
代入すると
となり、変換しないで計算した平方和と一致します。分散、標準偏差、変動係数については、従来通りの計算で算出できます。なぜ、変換後の平方和を100の2乗倍するのかというと変換後のデータは変換前のデータを100で割っており、平方和はデータを2乗して算出しますので(実際には偏差を2乗して算出しますので)、割った数の2乗でもどさなければならないからです。では、返還前にデータから引いた5はどうなるの?という疑問があると思います。平方和はばらつきを表す基本統計量ですので、元のデータに何を足そうが、引こうが、平方和には影響ありません。もっと、ちゃんとした理論がありますが、難しくなってしまいますので、このページでは割愛させていただきます。
以上のように、元のデータに同じ数を足したり(+)、引いたり(-)、掛けたり(×)、割ったり(÷)してもよく、うまく活用すれば、計算が非常に楽になりますし、ミスも防ぐことができますので、是非やり方を覚えてください。絶対に返還前の平均値、平方和に戻すことを忘れないでください。