V metodě statistických seskupení je souhrn studovaných jevů rozdělen do tříd a podtříd, které mají homogenní strukturu podle určitých charakteristik. Každé takové rozdělení je popsáno systémem statistických ukazatelů. Seskupená data mohou být prezentována v tabulkách.
Tato akce je hlavní metodou používanou při skutečném studiu společenských jevů. Vzniká jako předpoklad pro aplikaci různých seskupení statistik, postupů a analytických metod. Klasifikace je například nezbytná pro použití jakýchkoli zobecněných indexů, jako jsou průměry.
Příspěvek V. I. Lenina
V předrevolučních ruských statistikách, zejména v různých zemstvech (to jsou místní samosprávy), byly získány značné zkušenosti se seskupováním různých typů organizací. A také v té době se výrazně pracovalo na vývoji nejen tabulek s klasifikací jedna po druhécharakteristiky, ale i složitější schémata. V nich jsou všechna data seskupena podle dvou nebo více parametrů. Teoretické problémy související s používáním metod statistického seskupování však nebyly vědecky odůvodněny. Tento stav trval až do prací V. I. Lenin. Měl vysoké mínění o kognitivní hodnotě a praktickém významu klasifikace. S ohledem na tabulky založené na znacích statistického seskupení více než jedné charakteristiky Lenin napsal: „Bez nadsázky lze říci, že způsobí revoluci ve vědě a samozřejmě v zemědělské ekonomice.“
Zásadní význam mají doporučení Vladimíra Iljiče o potřebě předběžné politické a ekonomické analýzy povahy vzorců a stanovení typů jevů před zahájením experimentů s klasifikací výchozích dat.
Fáze statistického seskupování
Systematizace se využívá nejen při analýze struktury populace, ale také při určování typů jevů a při studiu vztahů mezi různými charakteristikami či faktory. Příklady seskupení, které vyjadřují strukturu populace, jsou klasifikace lidí podle věku (v intervalech jednoho roku nebo častěji po pěti letech) a podniků podle velikosti.
Kombinací tříd nebo nastavením nerovnoměrných intervalů je možné stanovit kvalitativní rozdíly mezi jednotlivými systémy a následně určit technicko-ekonomické nebo socioekonomické typy příslušných předmětů(například podniky nebo farmy). Seskupování obyvatelstva země podle věku tak může být provedeno kromě jednoduchých chronologických objektů také na základě speciálních dělení, jako jsou ženy ve věku 16 až 54 let a muži ve věku 16 až 59 let. Použití těchto speciálních tříd umožňuje vypočítat národní ekonomický index, známý jako pracovní síla země. Hranice intervalů jsou poněkud libovolné a mohou se stát od státu lišit.
Úkol
Podrobná kvantitativní klasifikace podniků a firem nám umožňuje přistoupit k definici několika základních kvalitativních skupin, jako jsou malé, střední a velké organizace. Poté lze objasnit řadu obecných ekonomických problémů, například proces koncentrace výroby, růst průmyslové efektivity a zvyšování produktivity práce. Nová data Vladimíra Iljiče Lenina o zákonech upravujících rozvoj kapitalismu v zemědělství jsou skvělým příkladem hluboké analýzy, která využívá seskupování k demonstraci komplexní povahy vzorců. A také vztah mezi velikostí podniku a jeho celkovou produktivitou.
Nejdůležitějším a nejobtížnějším úkolem statistických seskupení je identifikovat a podrobně popsat typy socioekonomických jevů. Takové subjekty představují vyjádření forem určitého společenského procesu nebo základních charakteristik. Zdá se, že jsou společné mnoha jednotlivým jevům. Ve své analýze stratifikace rolnictva použil Vladimír Iljič Lenin seskupenídůkladně a komplexně. Nejprve odhalil proces formování hlavních společenských tříd v předrevolučním Rusku, na západoevropském venkově a v zemědělství USA.
A jak se ukázalo, sovětská data mají značné zkušenosti s typologickými a statistickými seskupeními. Například bilance národního hospodářství SSSR předpokládá složitý a rozvětvený systém klasifikace. Mezi další příklady typologického statistického seskupení v sovětském prostoru patří systematizace obyvatelstva podle sociálních tříd. Stejně jako sjednocení fixních výrobních aktiv podle socioekonomických typů průmyslových jednotek. A můžete také uvést takový příklad, jako je seskupení statistické populace sociálního produktu.
Buržoazní klasifikace dostatečně nepoužívá systematizaci. Je-li použito seskupování, je z velké části nesprávné a nepřispívá k charakterizaci skutečného stavu věcí v kapitalistických zemích. Například klasifikace zemědělských podniků podle výměry půdy zveličuje postavení drobné výroby v tomto duchu. A seskupení obyvatelstva podle povolání neodhaluje skutečnou třídní strukturu buržoazní společnosti.
Sociálně-ekonomické charakteristiky socialistického státu poskytují nové aplikace pro statistické seskupování. Klasifikace slouží k analýze plnění národohospodářských plánů, ke zjištění příčin zaostávání některých podniků a odvětví. A také identifikovat nevyužité zdroje. Například podnikylze seskupit podle stupně realizace plánu nebo úrovně ziskovosti. Velký význam pro charakterizaci zavádění vědeckotechnického pokroku do průmyslu má seskupování podniků podle takových technických a ekonomických údajů, jako je stupeň automatizace a mechanizace a množství elektřiny dostupné pro práci.
Skupinová data jsou informace tvořené kombinací jednotlivých seskupení statistického pozorování o přítomnosti proměnné do samostatných tříd, takže frekvenční rozložení těchto systémů slouží jako vhodný prostředek pro shrnutí a analýzu všech materiálů.
Informace
Data lze definovat jako skupiny materiálů, které představují kvalitativní nebo kvantitativní atributy proměnné nebo sady proměnných. To je analogické tvrzení, že třídy mohou být libovolnou sadou informací, které popisují entitu. Systémy lze v seskupování statistických dat rozdělit na seskupené a neseskupené objekty.
Jakékoli informace, které osoba shromáždí jako první, nejsou utajované. Nesskupená statistická seskupení jsou data, ale pouze v nezpracované podobě. Příkladem takových systémů je jakýkoli seznam čísel, na který si vzpomenete.
První typ klasifikace
Skupinová data jsou informace, které byly uspořádány do skupin známých jako třídy. Tento typ již byl klasifikován a tedy i někteříúroveň analýzy. To znamená, že všechny informace již nejsou nezpracované.
Datová třída je skupina, která je spojena s konkrétní uživatelskou vlastností. Pokud například manažer podniku shromáždil lidi, které najímá v určitém roce, mohl je seskupit do systémů podle věku: dvacet, třicet, čtyřicet a tak dále. A každá z těchto skupin se nazývá třída.
Toto není poslední divize. Každá z těchto tříd má určitou šířku a tomu se říká rozteč nebo velikost. Tento koncept je velmi důležitý, pokud jde o vykreslování histogramů a grafů frekvence. Všechny třídy mohou mít stejnou nebo různou velikost v závislosti na tom, jak budou všechny informace seskupeny. Systémový interval je vždy celé číslo.
Omezení třídy a hranice
První koncept odkazuje na skutečné hodnoty, které lze vidět v závěrečné tabulce. Omezení třídy spadají do dvou kategorií: dolní mez systému a horní mez. Všechna rozdělení v tabulkách samozřejmě slouží k zajištění správnosti a informativnosti.
Ale na druhou stranu hranice tříd nejsou v tabulce četností vždy respektovány. Tento koncept udává skutečný interval systémů a stejně jako různá omezení je také rozdělen na hranice nižších a vyšších hodnot.
Živé a nežijící kapely
Věda se snaží porozumět a vysvětlit přírodní jevy. Vědci chápou věci tak, že je klasifikují. Patří toživé i neživé seskupení statistických materiálů.
Tyto typy lze dále rozdělit do skupin v závislosti na vlastnostech kontrastu. Pokud například studenti ve svých vědeckých časopisech sestavili seznamy různých materiálů a předmětů, které studovali, mohou tato data použít k rozšíření znalostí a informací o systémech, které studovali.
Všechny znalosti lze třídit nebo klasifikovat podle různých kontrastních vlastností. Zde je několik příkladů:
- Kovy versus různé nekovy.
- Kamenitý terén místo pouště nebo louky.
- Viditelné krystaly vs. neviditelné minerály.
- Přirozený proces místo umělého.
- Látky hustší než voda nebo méně těžké než daná kapalina.
- Magnetické versus nemagnetické.
A můžete také rozlišovat skupiny podle následujících funkcí:
- Stav hmoty při pokojové teplotě (pevná látka, kapalina, plyn).
- Tavitelnost kovů.
- Fyzikální vlastnosti a tak dále.
Materiály:
- Různé články, které ilustrují výše uvedené kategorie.
- Magnety pro testování vlastností materiálů.
- Nádoba s vodou pro kontrolu, zda věci plavou nebo klesají.
- Vědecké časopisy.
Provozní postup
Přesně jak se věci dějí:
- Studenti pracují ve skupinách. Každý dostane nějaké materiály a požádá, aby našel způsoby, jak se seskupitpoložky podle kategorie. Vyvinou kritéria, která budou používat, a podle toho položky seřadí. Tabulky výsledků jsou zaznamenány v jejich vědeckých časopisech.
- Po seskupení jsou materiály znovu seřazeny podle dalších kritérií. Dalším krokem bude také sestavení seznamu výsledků. A poté je zapsána další řada prvků, které byly seřazeny odlišně kvůli měnícím se kritériím.
- Studenti zaznamenávají pozorování a tabulky do svých vědeckých časopisů.
Results
Studenti opravují řadu tabulek, které ukazují, jak jsou jejich předměty seřazeny podle jednotlivých kritérií. Skupina studentů má například kancelářskou sponku, malý kousek žuly, korek, plastovou hračku. A pak by dvojice třídicích tabulek mohla vypadat následovně.
-
Položky seřazené podle magnetismu.
Reagovat na magnet: kancelářská sponka, žula. Neodpovídá: korek, plast.
-
Položky seřazené podle hustoty v porovnání s vodou.
Vyskakovací: korek, plast. Utonutí: kancelářská sponka, žula.
Poté studenti udělají před třídou prezentace. Diskutují o tom, proč jsou různé položky klasifikovány odlišně na základě použitých kritérií.
Studenti opakují tato pozorování pokaždé a používají různé vlastnosti.
Talk
V této fázi:
- Studenti mohou tato pozorování rozšířit na další materiály bez jakýchkolivpraktický výzkum.
- Příklady jsou vzorky různých typů hornin. Studenti se naučí, jak provádět bližší pozorování a psát přesně to, co vidí, pomocí lup a dalších předmětů, které používají.
- Pokud studenti vytvořili indexový soubor vlastností napsaných na kartách, lze je také třídit. To bude užitečné, pokud rejstřík obsahuje další materiály, které nejsou ve třídě.
Obvyklým způsobem zpracování nepřetržitých kvantitativních dat je rozdělení celého rozsahu významů do několika podrozsahů. Ke každému materiálu je nutné přiřadit konstantní hodnotu třídy, do které spadá. Všimněte si, že soubor dat se mění z nepřetržitého na diskrétní.
Koncept statistického seskupování
Organizace se provádí definováním sady rozsahů a následným počítáním množství dat, které do každého z nich spadá. Podrozsahy se nepřekrývají. Musí pokrývat celý rozsah datové sady.
Jedním z nejúspěšnějších způsobů vizualizace seskupených systémů je histogram. Je to sada obdélníků, kde základna obrázku zahrnuje hodnoty v rozsahu, který je s ním spojený. A výška odpovídá množství informací.