Sturges noteikums, lietojums un piemēri
The Sturges noteikums ir kritērijs, ko izmanto, lai noteiktu klasēs vai intervālos, kas nepieciešami, lai grafiski attēlotu statistikas datu kopumu. Šo noteikumu 1926. gadā noteica vācu matemātiķis Herbert Sturges.
Sturges ierosināja vienkāršu metodi, kuras pamatā ir paraugu skaits x, kas ļāva atrast nodarbību skaitu un to diapazona amplitūdu. Sturges noteikums tiek plaši izmantots, jo īpaši statistikas jomā, īpaši, lai izveidotu frekvenču histogrammas.
Indekss
- 1 Paskaidrojums
- 2 Pieteikumi
- 3 Piemērs
- 4 Atsauces
Paskaidrojums
Sturges noteikums ir empīriska metode, ko plaši izmanto aprakstošajā statistikā, lai noteiktu, cik klasēm ir jābūt frekvenču histogrammā, lai klasificētu datu kopumu, kas pārstāv paraugu vai populāciju.
Būtībā šis noteikums nosaka grafisko konteineru platumu, frekvenču histogrammas.
Lai noteiktu savu likumu, Herbert Sturges uzskatīja par ideālu frekvenču diagrammu, kas sastāv no K intervāliem, kur ith intervāls satur noteiktu skaitu paraugu (i = 0, ... k - 1), kas attēloti kā:
Šo paraugu skaitu nosaka to veidu skaits, kādā var iegūt komplekta apakškopu; tas ir, ar binomisko koeficientu, kas izteikts šādi:
Lai vienkāršotu izteiksmi, viņš pielietoja logaritmu īpašības abās vienādojuma daļās:
Tādējādi Sturges konstatēja, ka optimālo intervālu skaitu k sniedz izteiksme:
To var izteikt arī kā:
Šajā izteiksmē:
- k ir nodarbību skaits.
- N ir kopējais parauga novērojumu skaits.
- Žurnāls ir pamata 10 bāzes logaritms.
Piemēram, lai izveidotu frekvenču histogrammu, kas izpaužas nejaušā paraugā, kura augstums ir 142 bērni, to intervālu vai kategoriju skaits, kas būs izplatīšanai:
k = 1 + 3,322 * žurnāls10 (N)
k = 1 + 3,322* žurnāls (142)
k = 1 + 3,322* 2,1523
k = 8,14 ≈ 8
Tādējādi sadalījums būs 8 intervālos.
Intervālu skaits vienmēr jāatspoguļo ar veseliem skaitļiem. Gadījumos, kad vērtība ir decimāla, ir jāveic tuvākā veselā skaitļa tuvināšana.
Programmas
Sturges likums tiek piemērots galvenokārt statistikā, jo tas ļauj veikt frekvenču sadalījumu, aprēķinot klasu skaitu (k), kā arī katra no tām, kas pazīstams arī kā amplitūda.
Amplitūda ir starpība starp klases augšējo un apakšējo robežu, dalot to ar klašu skaitu, un to izsaka:
Ir daudz empīrisku noteikumu, kas ļauj veikt frekvenču sadalījumu. Tomēr Sturges noteikums parasti tiek izmantots, jo tas atbilst klasēm, kas parasti ir robežās no 5 līdz 15.
Šādā veidā ņemiet vērā vērtību, kas adekvāti atspoguļo paraugu vai populāciju; tas nozīmē, ka tuvināšana neatspoguļo ekstremālas grupas, un tā nedarbojas arī ar pārmērīgu skaitu klašu, kas neļauj apkopot paraugu..
Piemērs
Nepieciešams veikt frekvenču histogrammu saskaņā ar dotajiem datiem, kas atbilst vecumam, kas iegūts aptaujā vīriešiem, kuri vingrina vietējā sporta zālē..
Lai noteiktu intervālus, jums jāzina, kāds ir parauga lielums vai novērojumu skaits; šajā gadījumā jums ir 30.
Tad tiek piemērots Sturges noteikums:
k = 1 + 3,322 * žurnāls10 (N)
k = 1 + 3,322* žurnāls (30)
k = 1 + 3,322* 1,4771
k = 5.90 ≈ 6 intervāli.
No intervālu skaita var aprēķināt to amplitūdu; tas ir, katras joslas platums, kas attēlots frekvenču histogrammā:
Apakšējā robeža tiek uzskatīta par zemāko datu vērtību, un augšējā robeža ir augstākā vērtība. Atšķirību starp augšējo un apakšējo robežu sauc par mainīgā lieluma (R) diapazonu vai ceļu..
No galda mums ir, ka augšējā robeža ir 46 un apakšējā robeža 13; šādā veidā katras klases amplitūda būs:
Intervāli sastāv no augšējās un apakšējās robežas. Lai noteiktu šos intervālus, sāciet skaitīt no apakšējās robežas, pievienojot tai amplitūdu, kas noteikta saskaņā ar 6. noteikumu:
Tad tiek aprēķināta absolūtā frekvence, lai noteiktu katram intervālam atbilstošu vīriešu skaitu; šajā gadījumā tas ir:
- Intervāls 1: 13 - 18 = 9
- Intervāls 2: 19 - 24 = 9
- Intervāls 3: 25 - 30 = 5
- Intervāls 4: 31 - 36 = 2
- Intervāls 5: 37 - 42 = 2
- Intervāls 6: 43 - 48 = 3
Pievienojot katras klases absolūtu frekvenci, tam jābūt vienādam ar kopējo parauga skaitu; šajā gadījumā 30.
Pēc tam aprēķina katra intervāla relatīvo frekvenci, dalot šī intervāla absolūto frekvenci ar kopējo novērojumu skaitu:
- 1. intervāls: fi = 9 ÷ 30 = 0,30
- Intervāls 2: fi = 9 ÷ 30 = 0,30
- Intervāls 3: fi = 5 ÷ 30 = 0.1666
- Intervāls 4: fi = 2 ÷ 30 = 0,0666
- Intervāls 5: fi = 2 ÷ 30 = 0,0666
- Intervāls 4: fi = 3 ÷ 30 = 0,10
Pēc tam varat izveidot tabulu, kas atspoguļo datus, kā arī diagrammu no relatīvās frekvences attiecībā pret iegūtajiem intervāliem, kā redzams šādos attēlos:
Šādā veidā Sturges noteikums ļauj noteikt klasēm vai intervāliem, kuros paraugu var sadalīt, lai apkopotu datu paraugu, sagatavojot tabulas un grafikus.
Atsauces
- Alfonso Urquía, M. V. (2013). Diskrētu notikumu modelēšana un modelēšana. UNED,.
- Altman Naomi, M. K. (2015). "Vienkārša lineāra regresija." Dabas metodes .
- Antúnez, R. J. (2014). Statistika izglītībā. Digitālais UNID.
- Fox, J. (1997.). Lietotā regresijas analīze, lineārie modeļi un saistītās metodes. SAGE publikācijas.
- Humberto Llinás Solano, C. R. (2005). Aprakstoša statistika un varbūtības sadalījums. Ziemeļu universitāte.
- Panteleeva, O. V. (2005). Varbūtības un statistikas pamati.
- O. Kuehl, M. O. (2001). Eksperimentu izstrāde: Dizaina un pētījumu analīzes statistikas principi. Thomson redaktori.