Jak obliczyć emisje
W statystykach emisji - są to wartości, które są ostro różne od innych wartości w złożonym zestawie danych. Emisja może wskazywać anomalii w dystrybucji danych lub błędach w pomiarze, tak często emisje są wyłączone z zestawu danych. Wyklucz emisje z zestawu danych, możesz przyjść na nieoczekiwane lub dokładniejsze wnioski. Dlatego konieczne jest, aby móc obliczyć i oceniać emisje, aby zapewnić prawidłowe zrozumienie danych statystycznych.
Kroki
jeden. Naucz się rozpoznawać potencjalne emisje. Przed wyeliminowanie wartości wychodzących z zestawu danych należy określić potencjalne emisje. Emisje to wartości, które są bardzo różne od większości wartości w zestawie danych - innymi słowy, emisje leżą poza trendem większości wartości. Łatwo jest wykryć w tabelach wartości lub (szczególnie) na harmonogramach. Jeśli wartości w zestawie danych są na harmonogramie, emisje leżą daleko od większości innych wartości. Jeśli na przykład większość wartości leży dalej, a następnie emisje leżą po obu stronach takiego bezpośredniego.
- Na przykład rozważ zestaw danych reprezentujących temperaturę 12 różnych obiektów w pokoju. Jeśli 11 obiektów ma temperaturę około 70 stopni, ale dwunastym obiektem (ewentualnie piec) ma temperaturę 300 stopni, a następnie szybkie przeglądanie wartości może pokazać, że piec jest prawdopodobną emisją.
2. Ułóż dane rosnące. Pierwszym krokiem przy określaniu emisji jest obliczanie zestawu danych mediany. To zadanie jest znacznie uproszczone, jeśli wartości w zestawie danych znajdują się rosnąco (od mniejszych do więcej).
3. Oblicz mediany zestaw danych. Mediana DataSet jest wartością w środku zestawu danych. Jeśli zestaw danych zawiera nieparzystą liczbę wartości, mediana jest wartością, do której i po czym ta sama liczba wartości znajduje się w zestawie danych. Ale jeśli zestaw danych zawiera nawet liczbę wartości, musisz znaleźć średnią arytmetyczną dwóch średnich wartości. Należy pamiętać, że przy obliczaniu emisji mediany jest zwykle wskazany jako Q2, ponieważ leży między Q1 a Q3 - niższe i górne kwartały, które zdefiniujemy później.
cztery. Oblicz dolne kwartały. Ta wartość wskazana jako Q1, poniżej której leży 25% wartości z zestawu danych. Innymi słowy, jest połowa wartości zlokalizowanych przed medianiem. Jeśli mediana znajduje się nawet liczba wartości z zestawu danych, musisz znaleźć średnie arytmetyczne dwie średnie wartości, aby obliczyć Q1 (jest podobny do mediany obliczeń).
pięć. Oblicz górny kwartyl. Ta wartość wskazana jako Q3, powyżej której leży 25% wartości z zestawu danych. Proces obliczania Q3 jest podobny do procesu obliczania Q1, ale tutaj jest uważane za wartości znajdujące się po medianie.
6. Oblicz zasięg Eskerterter. Obliczanie Q1 i Q3, musisz znaleźć odległość między tymi wartościami. Aby to zrobić, odlicz Q1 z Q3. Wartość wnętrza jest niezwykle ważna dla określania granic wartości, które nie są emisjami.
7. Znajdź "Granice wewnętrzne" wartości w zestawie danych. Emisje są określane przez analizę wartości - niezależnie od tego, czy spadają, czy nie w granicach tak zwanych "wewnętrznych granic" i "granic zewnętrznych". Wartość przechodząca "wewnętrzna granice" jest klasyfikowana jako "nieznaczna emisja", podczas gdy wartość za "zewnętrznymi granicami" jest klasyfikowana jako "znacząca emisja". Aby znaleźć wewnętrzne granice, musisz dodać zakres eskarotyczny o 1,5 - wynik należy dodać do III kwartału i odliczyć od Q1. Znalezione dwie liczby są wewnętrznymi obramowaniem danych.
osiem. Znajdź zestaw danych "External Borders". Odbywa się to w taki sam sposób, jak w przypadku granic wewnętrznych, z wyjątkiem tego, że zakres interkomuniczny jest pomnożony przez 3, a nie przez 1,5. Wynik należy dodać do III i odejmij od Q1. Znalezione dwie liczby są zewnętrznymi obramowaniem danych.
dziewięć. Użyj oceny jakościowej, aby ustalić, czy wyeliminować emisje z zestawu danych. Opisana powyżej metoda pozwala określić, czy niektóre emisje (nieistotne lub znaczące) są. Jednak nie mylone - wartość sklasyfikowana jako emisja jest tylko "kandydatem" na wyjątek, czyli, że nie jesteś zobowiązany do wykluczenia go. Powodem pojawienia się emisji jest głównym czynnikiem wpływającym na decyzję o wykluczeniu emisji. Z reguły, emisje, które pojawiają się z powodu błędu (w pomiarach, zapisach, i tak dalej) są wykluczone. Z drugiej strony, emisje związane z brakiem błędów, ale z nowymi informacjami lub trendem, z reguły pozostawić w zestawie danych.
10. Oblicz znaczenie (czasami) emisje pozostawione w zestawie danych. Niektóre emisje muszą być wykluczone z zestawu danych, ponieważ ich powody są błędy i problemy techniczne - inne emisje należy pozostawić w zestawie danych. Jeśli na przykład emisja nie jest wynikiem błędu i / lub daje nowe zrozumienie zjawiska testowego, należy go pozostawić w zestawie danych. Eksperymenty naukowe są szczególnie wrażliwe na emisję - eliminując emisję przez pomyłkę, możesz pominąć nowy trend lub otwarcie.
Rada
- Po znalezieniu emisji spróbuj wyjaśnić swoją obecność, zanim ich wykluczysz z zestawu danych. Mogą wskazywać błędy lub anomalie pomiarowe w dystrybucji.
Czego potrzebujesz
- Kalkulator