Pearsonova distribuce: definice, aplikace

Obsah:

Pearsonova distribuce: definice, aplikace
Pearsonova distribuce: definice, aplikace
Anonim

Co je Pearsonův distribuční zákon? Odpověď na tuto širokou otázku nemůže být jednoduchá a stručná. Pearsonův systém byl původně navržen pro modelování viditelných zkreslených pozorování. V té době bylo dobře známo, jak vyladit teoretický model, aby odpovídal prvním dvěma kumulantům nebo momentům pozorovaných dat: jakékoli rozdělení pravděpodobnosti lze přímo rozšířit a vytvořit skupinu škál umístění.

Pearsonova hypotéza o normální distribuci kritérií

S výjimkou patologických případů může být škála lokalizace upravena tak, aby odpovídala pozorovanému průměru (první kumulant) a rozptylu (druhá kumulant) libovolným způsobem. Nebylo však známo, jak sestrojit rozdělení pravděpodobnosti, ve kterém by šikmost (standardizovaný třetí kumulant) a špičatost (standardizovaný čtvrtý kumulant) mohly být řízeny stejně volně. Tato potřeba se ukázala při pokusu přizpůsobit známé teoretické modely pozorovaným datům,který vykazoval asymetrii.

Ve videu níže můžete vidět analýzu Pearsonovy distribuce chi.

Image
Image

Historie

Ve své původní práci Pearson identifikoval čtyři typy distribucí (číslované I až IV) navíc k normální distribuci (která byla původně známá jako typ V). Klasifikace závisí na tom, zda jsou distribuce podporovány v omezeném intervalu, na poloose nebo na celé reálné čáře a zda byly potenciálně zkreslené nebo nutně symetrické.

V druhém článku byly opraveny dvě opomenutí: předefinoval rozdělení typu V (původně to bylo pouze normální rozdělení, ale nyní s inverzní gama) a zavedl rozdělení typu VI. První dva články dohromady pokrývají pět hlavních typů Pearsonova systému (I, III, IV, V a VI). Ve třetím článku Pearson (1916) představil další podtypy.

Pearsonovy distribuční funkce
Pearsonovy distribuční funkce

Vylepšit koncept

Rind vynalezl jednoduchý způsob, jak vizualizovat prostor parametrů systému Pearson (neboli rozložení kritérií), který později přijal. Dnes tuto metodu používá mnoho matematiků a statistiků. Typy Pearsonova rozdělení jsou charakterizovány dvěma veličinami, obvykle nazývanými β1 a β2. První je čtverec asymetrie. Druhým je tradiční špičatost neboli čtvrtý standardizovaný moment: β2=γ2 + 3.

Moderní matematické metody definují špičatost γ2 jako kumulanty místo momentů, takže pro normálnírozdělení máme γ2=0 a β2=3. Zde se vyplatí sledovat historický precedens a použít β2. Diagram vpravo ukazuje, jaký typ je konkrétní Pearsonovo rozdělení (označeno tečkou (β1, β2).

Pearsonovy statistiky
Pearsonovy statistiky

Mnoho zkreslených a/nebo nemezokurtických distribucí, které známe dnes, ještě nebylo známo na počátku 90. let 19. století. To, co je nyní známé jako beta distribuce, použil Thomas Bayes jako zadní parametr Bernoulliho distribuce ve svém dokumentu z roku 1763 o inverzní pravděpodobnosti.

Beta distribuce se dostala do popředí díky své přítomnosti v systému Pearson a byla známá až do 40. let jako distribuce Pearson typu I. Distribuce typu II je zvláštní případ typu I, ale obvykle se již nevyčleňuje.

Distribuce Gamma vznikla z jeho vlastní práce a byla známá jako Pearson Type III Normal Distribution, než získala svůj moderní název ve 30. a 40. letech 20. století. Článek vědce z roku 1895 představil distribuci typu IV, která obsahuje Studentovu t-distribuci, jako zvláštní případ, který o několik let předcházel následnému použití Williamem Seelym Gossetem. Jeho práce z roku 1901 představila distribuci s inverzní gama (typ V) a beta prvočísla (typ VI).

Jiný názor

Podle Orda vyvinul Pearson základní tvar rovnice (1) na základě vzorce pro derivaci logaritmu funkce hustoty normálního rozdělení (která dává lineární dělení kvadratickýmstruktura). Mnoho specialistů se stále zabývá testováním hypotézy o distribuci Pearsonových kritérií. A dokazuje svou účinnost.

Alternativní Pearsonova distribuce
Alternativní Pearsonova distribuce

Kdo byl Karl Pearson

Karl Pearson byl anglický matematik a biostatistik. Zasloužil se o vytvoření disciplíny matematické statistiky. V roce 1911 založil první katedru statistiky na světě na University College London a významně přispěl k oborům biometrie a meteorologie. Pearson byl také zastáncem sociálního darwinismu a eugeniky. Byl chráněncem a životopiscem sira Francise G altona.

Biometrie

Karl Pearson se zasloužil o vytvoření školy biometrie, což byla konkurenční teorie pro popis evoluce a dědičnosti populací na přelomu 20. století. Jeho série osmnácti prací „Matematické příspěvky k teorii evoluce“ho ustanovila jako zakladatele biometrické školy dědičnosti. Ve skutečnosti Pearson věnoval většinu svého času v letech 1893-1904 vývoj statistických metod pro biometrii. Tyto metody, které se dnes široce používají pro statistickou analýzu, zahrnují chí-kvadrát test, standardní odchylku, korelační a regresní koeficienty.

Pearsonův korelační koeficient
Pearsonův korelační koeficient

Otázka dědičnosti

Pearsonův zákon dědičnosti uváděl, že zárodečná plazma se skládá z prvků zděděných od rodičů i od vzdálenějších předků, jejichž podíl se měnil podle různých vlastností. Karl Pearson byl G altonovým stoupencem, a přestože jejichpráce se v některých ohledech lišily, Pearson použil značné množství statistických pojmů svého učitele při formulování biometrické školy pro dědičnost, jako je zákon regrese.

Pearsonova distribuce
Pearsonova distribuce

Funkce školy

Biometrická škola, na rozdíl od Mendeliánů, nebyla zaměřena na poskytování mechanismu pro dědičnost, ale na poskytování matematického popisu, který neměl kauzální povahu. Zatímco G alton navrhoval nespojitou evoluční teorii, ve které by se druhy měnily spíše velkými skoky než malými změnami, které se nashromáždily v průběhu času, Pearson poukázal na nedostatky v tomto argumentu a ve skutečnosti své myšlenky použil k rozvoji kontinuální evoluční teorie. Mendelovci preferovali nespojitou evoluční teorii.

Zatímco G alton se zaměřil hlavně na aplikaci statistických metod na studium dědičnosti, Pearson a jeho kolega Weldon rozšířili své úvahy v této oblasti, variací, korelací přirozeného a sexuálního výběru.

Typická distribuce
Typická distribuce

Pohled na evoluci

Pro Pearsona nebyla evoluční teorie určena k identifikaci biologického mechanismu, který vysvětluje vzorce dědičnosti, zatímco mendelovský přístup prohlásil gen za mechanismus dědičnosti.

Pearson kritizoval Batesona a další biology za to, že při studiu evoluce nepřijali biometrické metody. Odsoudil vědce, kteří se nezaměřili nastatistická platnost jejich teorií, uvádějící:

"Než budeme moci přijmout [jakoukoli příčinu progresivní změny] jako faktor, musíme nejen ukázat její věrohodnost, ale pokud možno prokázat její kvantitativní schopnost."

Biologové podlehli „téměř metafyzickým spekulacím o příčinách dědičnosti“, které nahradily proces shromažďování experimentálních dat, což ve skutečnosti může vědcům umožnit zúžit potenciální teorie.

statistický most
statistický most

Zákony přírody

Pro Pearsona byly přírodní zákony užitečné pro vytváření přesných předpovědí a pro shrnutí trendů v pozorovaných datech. Důvodem byla zkušenost, „že se určitá sekvence stala a opakovala v minulosti.“

Identifikace konkrétního mechanismu genetiky tedy nebyla pro biology záslužnou snahou, kteří by se měli místo toho zaměřit na matematické popisy empirických dat. To částečně vedlo k ostrému sporu mezi biometristy a Mendeliany, včetně Batesona.

Poté, co Pearson odmítl jeden z Pearsonových rukopisů popisujících novou teorii variací nebo homotypií potomků, založili Pearson a Weldon v roce 1902 společnost Biometrika. Ačkoli biometrický přístup k dědičnosti nakonec ztratil svou mendelovskou perspektivu, metody, které v té době vyvinuli, jsou životně důležité pro studium biologie a evoluce dnes.

Doporučuje: