Ako vypočítať emisie
V emisných štatistikách - to sú hodnoty, ktoré sú ostro odlišné od iných hodnôt v zostavenom súbore údajov. Emisie môže naznačovať anomálie pri distribúcii údajov alebo chybách v meraní, takže často sú emisie vylúčené z súboru údajov. Vylúčiť emisie zo súboru údajov, môžete prísť k neočakávaným alebo presnejším záverom. Preto je potrebné byť schopný vypočítať a hodnotiť emisie, aby sa zabezpečilo riadne pochopenie štatistických údajov.
Kroky
jeden. Naučte sa rozpoznať potenciálne emisie. Skôr ako odstránite odchádzajúce hodnoty z údajov z údajov, mali by sa určiť potenciálne emisie. Emisie sú hodnoty, ktoré sú veľmi odlišné od väčšiny hodnôt v súbore údajov - inými slovami, emisie ležia mimo trendu väčšiny hodnôt. Je ľahké zistiť v tabuľkách hodnôt alebo (najmä) na plánoch. Ak sú hodnoty v súbore údajov na harmonograme, potom emisie budú ležať ďaleko od väčšiny ostatných hodnôt. Ak napríklad väčšina hodnôt leží dopredu, potom emisie ležia na oboch stranách takéhoto priameho.
- Zvážte napríklad súbor údajov predstavujúcich teplotu 12 rôznych objektov v miestnosti. Ak má 11 objektov teploty približne 70 stupňov, ale dvanásty objekt (prípadne pec) má teplotu 300 stupňov, potom rýchle prezeranie hodnôt môže preukázať, že pec je pravdepodobne emisie.

2. Usporiadať údaje vzostupne. Prvým krokom pri určovaní emisií je výpočet mediánu údajov. Táto úloha je výrazne zjednodušená, ak sa hodnoty v súbore údajov nachádzajú vzostupne (z menšieho na viac).

3. Vypočítať stredný súbor údajov. Medián Dataset je hodnota uprostred súboru údajov. Ak súbor údajov obsahuje nepárny počet hodnôt, medián je hodnota, ku ktorej a po čom sa nachádza rovnaký počet hodnôt v súbore údajov. Ak však súbor údajov obsahuje párny počet hodnôt, musíte nájsť aritmetický priemer dvoch stredných hodnôt. Všimnite si, že pri výpočte mediánskych emisií sa zvyčajne označuje ako Q2, pretože leží medzi Q1 a Q3 - Dolné a horné štvrťroky, ktoré budeme definovať neskôr.

4. Vypočítajte nižšie štvrtiny. Táto hodnota označená ako Q1, pod ktorou leží 25% hodnôt zo súboru údajov. Inými slovami, je polovica hodnôt umiestnených pred mediánom. Ak medián leží párny počet hodnôt z údajov, musíte nájsť priemerné aritmetické dva priemerné hodnoty na výpočet Q1 (je to podobné strednému výpočtu).

päť. Vypočítajte horný kvartil. Táto hodnota označená ako Q3, nad ktorou leží 25% hodnôt z súboru údajov. Proces výpočtu Q3 je podobný procesu výpočtu Q1, ale tu sa považuje za hodnoty umiestnené po mediáne.

6. Vypočítajte rozsah ESCKELTER. Výpočet Q1 a Q3, musíte nájsť vzdialenosť medzi týmito hodnotami. Urobiť to, odpočítať Q1 od Q3. Hodnota pripojenia je mimoriadne dôležité pre určenie hraníc hodnôt, ktoré nie sú emisie.

7. Nájsť "vnútorné hranice" hodnôt v súbore údajov. Emisie sa určujú prostredníctvom analýzy hodnôt - či už padajú alebo nie v rámci limitov tzv. "Interných hraniciach" a "vonkajších hraníc". Hodnota, ktorá prechádza "vnútorné hranice", je klasifikovaná ako "nevýznamné emisie", zatiaľ čo hodnota za "vonkajšie hranice" je klasifikovaná ako "významné emisie". Ak chcete nájsť vnútorné hranice, musíte pridať escarotický rozsah 1,5- výsledok musí byť pridaný do Q3 a odpočítať od Q1. Zistené dve čísla sú interné údaje o nastavení údajov.


osem. Nájsť "externé hranice". To sa vykonáva rovnakým spôsobom ako pre vnútorné hranice, okrem toho, že medzikomunikačný rozsah sa vynásobí 3, a nie 1,5. Výsledok sa musí pridať do Q3 a odčítanie od Q1. Zistené dve čísla sú hranice externých údajov.


deväť. Použite kvalitatívne hodnotenie, aby ste zistili, či odstrániť emisie z súboru údajov. Vyššie opísaná metóda umožňuje určiť, či niektoré emisie (nevýznamné alebo významné) sú. Avšak, nie mylné - hodnota klasifikovaná ako emisie je len "kandidát" pre výnimku, to znamená, že nie ste povinní vylúčiť. Dôvodom vzniku emisií je hlavným faktorom, ktorý ovplyvňuje rozhodnutie vylúčiť emisie. Emisie, ktoré vznikajú kvôli chybe (v meraniach, záznamoch a tak ďalej), sú spravidla vylúčené emisie, ktoré vznikajú z dôvodu chyby (v meraniach, záznamoch a tak ďalej). Na druhej strane emisie súvisiace s chybami, ale s novými informáciami alebo trendmi, spravidla odísť v súbore údajov.

10. Vypočítajte význam (niekedy) emisie, ktoré zostali v súbore údajov. Niektoré emisie musia byť z údajov údajov vylúčené, pretože ich dôvody sú chyby a technické problémy - ostatné emisie musia byť ponechané v súbore údajov. Ak napríklad emisia nie je výsledkom chyby a / alebo poskytuje nové pochopenie testovacieho fenoménu, potom musí byť ponechaný v súbore údajov. Vedecké experimenty sú obzvlášť citlivé na emisie - eliminujú emisie omylom, môžete preskočiť nový trend alebo otvorenie.
Tipy
- Keď sa zistia emisie, pokúste sa vysvetliť ich prítomnosť predtým, ako ich vylúčíte zo súboru údajov. Môžu uviesť chyby merania alebo anomálie v distribúcii.
Čo potrebuješ
- Kalkulačka