情報

分位点を理解する:定義と用途

分位点を理解する:定義と用途


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

中央値、第1四分位数、第3四分位数などの要約統計は、位置の測定値です。これは、これらの数値が、データの分布の特定の割合がどこにあるかを示しているためです。たとえば、中央値は調査中のデータの中央の位置です。データの半分は、中央値より小さい値を持っています。同様に、データの25%には最初の四分位より小さい値があり、データの75%には3番目の四分位より小さい値があります。

この概念は一般化できます。これを行う1つの方法は、パーセンタイルを考慮することです。 90パーセンタイルは、データの90%がこの数値より小さい値を持つポイントを示します。より一般的には、 pthパーセンタイルは数です n そのために pデータの%は n.

連続ランダム変数

中央値、第1四分位数、および第3四分位数の順序統計は、通常、離散データセットの設定で導入されますが、これらの統計は連続ランダム変数に対しても定義できます。連続分布で作業しているため、積分を使用します。の pthパーセンタイルは数値です n そのような:

-₶n f ( バツ ) dx = p/100.

ここに f ( バツ )は確率密度関数です。したがって、連続分布に必要なパーセンタイルを取得できます。

分位点

さらなる一般化は、注文統計が作業している分布を分割していることに注意することです。中央値はデータセットを半分に分割し、中央値、つまり連続分布の50パーセンタイルは、面積に関して分布を半分に分割します。最初の四分位数、中央値、および3番目の四分位数は、データを4つの部分に分割し、それぞれで同じカウントを持ちます。上記の積分を使用して、25、50、75パーセンタイルを取得し、連続分布を等しい面積の4つの部分に分割できます。

この手順を一般化できます。始めることができる質問には自然数が与えられます n、変数の分布をどのように分割できますか n 同じサイズの作品?これは、変位値の概念に直接語ります。

n データを順番にランク付けし、このランキングを n -間隔上に等間隔の1つのポイント。

連続確率変数の確率密度関数がある場合、上記の積分を使用して変位値を見つけます。ために n 変位値、私たちが欲しい:

  • 最初に1 /n 分布の左側の領域。
  • 2番目に2番目のn 分布の左側の領域。
  • r持つべき r/n 分布の左側の領域。
  • 持っている最後の(n - 1)/n 分布の左側の領域。

どんな自然数でも nn 100に対応する分位数r/nthパーセンタイル、ここで r 1から任意の自然数を指定できます n - 1.

一般的な分位数

特定のタイプの変位値は、特定の名前を付けるのに十分なほど一般的に使用されます。以下はこれらのリストです。

  • 2分位は中央値と呼ばれます
  • 3分位はtercilesと呼ばれます
  • 4分位は四分位数と呼ばれます
  • 5分位は五分位数と呼ばれます
  • 6分位は六分位数と呼ばれます
  • 7分位はセプタイルと呼ばれます
  • 8分位はオクタイルと呼ばれます
  • 10個の変位値はdecilesと呼ばれます
  • 12分位は十二指腸と呼ばれます
  • 20個の分位点はvigintilesと呼ばれます
  • 100分位はパーセンタイルと呼ばれます
  • 1000分位はパーミルと呼ばれます

もちろん、上記のリストにあるもの以外にも他の変位値が存在します。多くの場合、使用される特定の変位値は、連続分布からのサンプルのサイズと一致します。

分位数の使用

データのセットの位置を指定することに加えて、分位数は他の方法で役立ちます。母集団から単純なランダムサンプルがあり、母集団の分布が不明であるとします。正規分布やワイブル分布などのモデルが、サンプリングした母集団に適しているかどうかを判断するために、データとモデルの分位数を調べることができます。

サンプルデータの変位値を特定の確率分布の変位値に一致させると、結果はペアのデータのコレクションになります。これらのデータは、分位値-分位数プロットまたはq-qプロットとして知られる散布図にプロットします。結果の散布図がほぼ線形の場合、モデルはデータに適しています。


Video, Sitemap-Video, Sitemap-Videos