Ako vypočítať emisie

V emisných štatistikách - to sú hodnoty, ktoré sú ostro odlišné od iných hodnôt v zostavenom súbore údajov. Emisie môže naznačovať anomálie pri distribúcii údajov alebo chybách v meraní, takže často sú emisie vylúčené z súboru údajov. Vylúčiť emisie zo súboru údajov, môžete prísť k neočakávaným alebo presnejším záverom. Preto je potrebné byť schopný vypočítať a hodnotiť emisie, aby sa zabezpečilo riadne pochopenie štatistických údajov.

Kroky

  1. Obrázok s názvom Vypočítajte odľahlé hodnoty Krok 1
jeden. Naučte sa rozpoznať potenciálne emisie. Skôr ako odstránite odchádzajúce hodnoty z údajov z údajov, mali by sa určiť potenciálne emisie. Emisie sú hodnoty, ktoré sú veľmi odlišné od väčšiny hodnôt v súbore údajov - inými slovami, emisie ležia mimo trendu väčšiny hodnôt. Je ľahké zistiť v tabuľkách hodnôt alebo (najmä) na plánoch. Ak sú hodnoty v súbore údajov na harmonograme, potom emisie budú ležať ďaleko od väčšiny ostatných hodnôt. Ak napríklad väčšina hodnôt leží dopredu, potom emisie ležia na oboch stranách takéhoto priameho.
  • Zvážte napríklad súbor údajov predstavujúcich teplotu 12 rôznych objektov v miestnosti. Ak má 11 objektov teploty približne 70 stupňov, ale dvanásty objekt (prípadne pec) má teplotu 300 stupňov, potom rýchle prezeranie hodnôt môže preukázať, že pec je pravdepodobne emisie.
  • Obrázok s názvom Vypočítať OXTLERS KROKST
    2. Usporiadať údaje vzostupne. Prvým krokom pri určovaní emisií je výpočet mediánu údajov. Táto úloha je výrazne zjednodušená, ak sa hodnoty v súbore údajov nachádzajú vzostupne (z menšieho na viac).
  • Pokračovanie vyššie uvedeného príkladu, zvážte nasledujúci súbor údajov, ktoré predstavujú teploty niekoľkých objektov: {71, 70, 73, 70, 70, 71, 72, 72, 71, 71, 72, 71, 72, 72, 71. Táto súprava sa musí objednať nasledovne: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  • Obrázok s názvom Vypočítať OXTLERS KROK 3
    3. Vypočítať stredný súbor údajov. Medián Dataset je hodnota uprostred súboru údajov. Ak súbor údajov obsahuje nepárny počet hodnôt, medián je hodnota, ku ktorej a po čom sa nachádza rovnaký počet hodnôt v súbore údajov. Ak však súbor údajov obsahuje párny počet hodnôt, musíte nájsť aritmetický priemer dvoch stredných hodnôt. Všimnite si, že pri výpočte mediánskych emisií sa zvyčajne označuje ako Q2, pretože leží medzi Q1 a Q3 - Dolné a horné štvrťroky, ktoré budeme definovať neskôr.
  • Nebojte sa pracovať s dátovými súbormi, v ktorých sa dokonca počet hodnôt - priemerné aritmetické dva priemerné hodnoty budú číslo, ktoré nie je v súbore údajov, je normálne. Ak však dve stredné hodnoty sú rovnaké, potom aritmetický priemer sa rovná tomuto číslu, je to aj v poradí vecí.
  • Vo vyššie uvedenom príklade sú priemerné 2 hodnoty 70 a 71, takže medián je rovný ((70 + 71) / 2) = 70,5.
  • Obrázok s názvom Vypočítajte odľahlé hodnoty Krok 4
    4. Vypočítajte nižšie štvrtiny. Táto hodnota označená ako Q1, pod ktorou leží 25% hodnôt zo súboru údajov. Inými slovami, je polovica hodnôt umiestnených pred mediánom. Ak medián leží párny počet hodnôt z údajov, musíte nájsť priemerné aritmetické dva priemerné hodnoty na výpočet Q1 (je to podobné strednému výpočtu).
  • V našom príklade sa po mediáni a 6 hodnotách nachádza 6 hodnôt. To znamená, že na výpočet dolného kvartilu, musíme nájsť aritmetický priemer dvoch priemerov šiestich hodnôt ležiacich mediánu. Tu sú priemerné hodnoty 70 a 70. Tak, Q1 = ((70 + 70) / 2) = 70.
  • Obrázok s názvom Vypočítať odľahlé hodnoty Krok 5
    päť. Vypočítajte horný kvartil. Táto hodnota označená ako Q3, nad ktorou leží 25% hodnôt z súboru údajov. Proces výpočtu Q3 je podobný procesu výpočtu Q1, ale tu sa považuje za hodnoty umiestnené po mediáne.
  • Vo vyššie uvedenom príklade sú dve stredné hodnoty zo šiestich hodnôt ležiace po mediánu 71 a 72. Tak, Q3 = ((71 + 72) / 2) = 71,5.
  • Obrázok s názvom Vypočítajte odľahlé hodnoty Krok 6
    6. Vypočítajte rozsah ESCKELTER. Výpočet Q1 a Q3, musíte nájsť vzdialenosť medzi týmito hodnotami. Urobiť to, odpočítať Q1 od Q3. Hodnota pripojenia je mimoriadne dôležité pre určenie hraníc hodnôt, ktoré nie sú emisie.
  • V našom príklade Q1 = 70 a Q3 = 71.5. Medzikomunikačný rozsah je 71,5 - 70 = 1,5.
  • Upozorňujeme, že sa to týka záporných hodnôt Q1 a Q3. Napríklad, ak Q1 = -70, potom je medzikomunikačný rozsah 71,5 - (-70) = 141,5.
  • Obrázok s názvom Vypočítať OXTLERS KROK 7
    7. Nájsť "vnútorné hranice" hodnôt v súbore údajov. Emisie sa určujú prostredníctvom analýzy hodnôt - či už padajú alebo nie v rámci limitov tzv. "Interných hraniciach" a "vonkajších hraníc". Hodnota, ktorá prechádza "vnútorné hranice", je klasifikovaná ako "nevýznamné emisie", zatiaľ čo hodnota za "vonkajšie hranice" je klasifikovaná ako "významné emisie". Ak chcete nájsť vnútorné hranice, musíte pridať escarotický rozsah 1,5- výsledok musí byť pridaný do Q3 a odpočítať od Q1. Zistené dve čísla sú interné údaje o nastavení údajov.
  • V našom príklade sa intercombanitový rozsah rovný (71,5 - 70) = 1,5. Ďalšie: 1,5 * 1,5 = 2,25. Toto číslo musí byť pridané do Q3 a odpočítať ho od Q1, aby ste našli vnútorné hranice:
  • 71,5 + 2,25 = 73,75
  • 70 - 2,25 = 67,75
  • Teda vnútorné hranice sú rovnaké 67,75 a 73,75.
  • V našom príklade je len teplota pece - 300 stupňov - leží mimo týchto hraniciach a môže byť považovaný za maloletého. Ale nie ponáhľať so závermi, je potrebné určiť, či táto teplota je významné emisie. Obrázok s názvom Vypočítať OXTLERS KROKU 7BULLET2
  • Obrázok s názvom Vypočítajte odľahlé hodnoty Krok 8
    osem. Nájsť "externé hranice". To sa vykonáva rovnakým spôsobom ako pre vnútorné hranice, okrem toho, že medzikomunikačný rozsah sa vynásobí 3, a nie 1,5. Výsledok sa musí pridať do Q3 a odčítanie od Q1. Zistené dve čísla sú hranice externých údajov.
  • V našom príklade vynásobte escarotický rozsah 3: 1,5 * 3 = 4.5. Vypočítajte vonkajšie hranice:
  • 71,5 + 4,5 = 76
  • 70 - 4,5 = 65,5
  • Vonkajšie hranice sú teda rovné 65,5 a 76.
  • Akékoľvek hodnoty, ktoré sú mimo vonkajších hraniciach, sa považujú za významné emisie. V našom príklade sa teplota pece - 300 stupňov - považuje za významné emisie.Obrázok s názvom Vypočítať OXTLERS KROKU 8BULLET2
  • Obrázok s názvom Vypočítať OXTLIERY KROKU 9
    deväť. Použite kvalitatívne hodnotenie, aby ste zistili, či odstrániť emisie z súboru údajov. Vyššie opísaná metóda umožňuje určiť, či niektoré emisie (nevýznamné alebo významné) sú. Avšak, nie mylné - hodnota klasifikovaná ako emisie je len "kandidát" pre výnimku, to znamená, že nie ste povinní vylúčiť. Dôvodom vzniku emisií je hlavným faktorom, ktorý ovplyvňuje rozhodnutie vylúčiť emisie. Emisie, ktoré vznikajú kvôli chybe (v meraniach, záznamoch a tak ďalej), sú spravidla vylúčené emisie, ktoré vznikajú z dôvodu chyby (v meraniach, záznamoch a tak ďalej). Na druhej strane emisie súvisiace s chybami, ale s novými informáciami alebo trendmi, spravidla odísť v súbore údajov.
  • Rovnako dôležité je odhadnúť vplyv emisií do stredného súboru údajov (či už ho skreslia). Toto je obzvlášť dôležité, keď urobíte závery na základe mediánskeho súboru údajov.
  • V našom príklade je extrémne nepravdepodobné, že pec sa bude zahrievať na teplotu 300 stupňov (ak nie je len zohľadniť prírodné anomálie). Preto je možné uzavrieť (s vysokým podielom dôvery), že takáto teplota je chyba merania, ktorú chcete vylúčiť zo súboru údajov. Okrem toho, ak nevylučujete emisie, mediánový súbor údajov sa rovná (69 + 69 + 70 + 70 + 70 + 72 + 73 + 300) / 12 = 89,67 stupňov, ale ak vylučujete emisie, medián sa rovná (69 + 69 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 stupňov.
  • Emisie sú zvyčajne výsledkom ľudských chýb, takže emisie musia byť vylúčené z súborov údajov.
  • Obrázok s názvom Vypočítajte odľahlé hodnoty Krok 10
    10. Vypočítajte význam (niekedy) emisie, ktoré zostali v súbore údajov. Niektoré emisie musia byť z údajov údajov vylúčené, pretože ich dôvody sú chyby a technické problémy - ostatné emisie musia byť ponechané v súbore údajov. Ak napríklad emisia nie je výsledkom chyby a / alebo poskytuje nové pochopenie testovacieho fenoménu, potom musí byť ponechaný v súbore údajov. Vedecké experimenty sú obzvlášť citlivé na emisie - eliminujú emisie omylom, môžete preskočiť nový trend alebo otvorenie.
  • Napríklad vyvíjame nový liek na zvýšenie veľkosti rýb v rybolove. Budeme používať starý súbor údajov ({71, 70, 73, 70, 70, 70, 70, 72, 71, 70, 70, 70, 72, 71, 300, 71, 69}), ale tentoraz bude veľa rýb (v gramoch) po prijatí Experimentálny liek. Inými slovami, prvý liek vedie k zvýšeniu hmotnosti rýb až do 71 g, druhého lieku - až 70 g a tak ďalej. V tejto situácii je 300 významné emisie, ale nemali by sme to vylúčiť - ak predpokladáme, že neexistovali žiadne chyby merania, potom takéto emisie je významným úspechom v experimente. Droga, že zvýšená hmotnosť rýb až 300 gramov pôsobí výrazne lepšie ako iné lieky - týmto spôsobom je 300 najdôležitejšou hodnotou v súbore údajov.
  • Tipy

    • Keď sa zistia emisie, pokúste sa vysvetliť ich prítomnosť predtým, ako ich vylúčíte zo súboru údajov. Môžu uviesť chyby merania alebo anomálie v distribúcii.

    Čo potrebuješ

    • Kalkulačka
    Podobné publikácie