データのばらつきを表す基本統計量である「範囲」を説明します。
QCの世界では、データの中心だけでなく、データのばらつきに着目することでいろいろな解析を行うことができます。。例えばこんなデータを考えてみましょう。
データ1:2 4 5 6 8
データ2:1 3 5 7 9
データ1もデータ2もデータ数n=5で、平均値は同じ5です。しかし、データ1とデータ2では、直感的にばらつきが同じではないことがわかりませんか。数値的に認識するために範囲と呼ばれるばらつきを表す基本統計量を計算します。範囲(範囲はRangeと書くのでRという)は次の式で表します。
範囲R=データの最大値-データの最小値
データ1とデータ2の範囲を計算すると
データ1の範囲R1=8-2=6
データ2の範囲R2=9-1=8
となりました。R1はデータ1の範囲をR2はデータ2の範囲を表します。このように2つのデータの集まりがあり、平均値が同じでも範囲の計算によりばらつきが違うことがわかりました。
範囲Rはばらつきを表す基本統計量ですが、弱点があります。データの最大値と最小値しか計算に使っていないので、使っていないデータの情報が入っていないことです。例えば、最小値もしくは最大値のみが異常に小さいまたは大きい場合、そのデータに引っ張られてしまいます。