Statistik - Statistic

En statistik (singular) eller provstatistik är varje kvantitet som beräknas från värden i ett urval som betraktas för ett statistiskt ändamål. Statistiska ändamål inkluderar uppskattning av en populationsparameter , beskrivning av ett urval eller utvärdering av en hypotes. Den genomsnittliga (eller medelvärdet) av sampelvärden är en statistik. Termen statistik används både för funktionen och för funktionens värde på ett givet prov. När en statistik används för ett specifikt ändamål kan den hänvisas till med ett namn som anger dess syfte.

När en statistik används för att uppskatta en populationsparameter kallas statistiken för en estimator . En populationsparameter är vilken egenskap som helst hos en population som studeras, men när det inte är möjligt att direkt mäta värdet på en populationsparameter används statistiska metoder för att utläsa det sannolika värdet av parametern på grundval av en statistik beräknad från ett urval taget från befolkningen. Till exempel prov medelvärdet är en opartisk estimator av populationens medelvärde . Detta innebär att det förväntade värdet på provmedlet är lika med det verkliga populationsmedlet.

En beskrivande statistik används för att sammanfatta provdata. En teststatistik används vid statistisk hypotesprovning . Observera att en enda statistik kan användas för flera ändamål - exempelvis kan medelvärdet användas för att uppskatta populationsmedelvärdet, för att beskriva en provdatauppsättning eller för att testa en hypotes.

Exempel

Några exempel på statistik är:

  • "I en nyligen genomförd undersökning av amerikaner säger 52% av republikanerna att global uppvärmning sker."

I detta fall är "52%" en statistik, nämligen andelen republikaner i undersökningen som tror på global uppvärmning. Befolkningen är uppsättningen av alla republikaner i USA, och befolkningsparametern som uppskattas är andelen av alla republikaner i USA, inte bara de undersökta, som tror på global uppvärmning.

  • "Chefen för ett stort hotell nära Disney World indikerade att 20 utvalda gäster hade en genomsnittlig vistelsetid på 5,6 dagar."

I detta exempel är "5,6 dagar" en statistik, nämligen den genomsnittliga vistelsetiden för vårt urval av 20 hotellgäster. Befolkningen är uppsättningen för alla gäster på detta hotell, och befolkningsparametern som uppskattas är den genomsnittliga vistelsetiden för alla gäster. Observera att huruvida estimatorn är opartisk i detta fall beror på urvalet av urval. se inspektionsparadoxen .

Det finns en mängd olika funktioner som används för att beräkna statistik. Några inkluderar:

Egenskaper

Observerbarhet

En statistik är en slumpmässig variabel som kan observeras , som skiljer den både från en parameter som är en allmänt oobserverbar kvantitet som beskriver en egenskap hos en statistisk population , och från en oobserverbar slumpmässig variabel, till exempel skillnaden mellan en observerad mätning och ett populationsgenomsnitt. En parameter kan bara beräknas exakt om hela befolkningen kan observeras utan fel; till exempel i en perfekt folkräkning eller för en population av standardiserade testtagare.

Statistiker överväger ofta en parametrerad familj av sannolikhetsfördelningar , varav varje medlem kan vara fördelningen av någon mätbar aspekt av varje medlem i en befolkning, från vilken ett urval slumpmässigt tas. Till exempel kan parametern vara den genomsnittliga höjden för 25-åriga män i Nordamerika. Höjden på medlemmarna i ett urval på 100 sådana män mäts; genomsnittet av de 100 siffrorna är en statistik. Genomsnittet av höjderna för alla medlemmar i befolkningen är inte en statistik om det inte på något sätt också har fastställts (till exempel genom att mäta varje medlem i befolkningen). Den genomsnittliga höjden som skulle beräknas med alla individuella höjder för alla 25-åriga nordamerikanska män är en parameter och inte en statistik.

Statistiska egenskaper

Viktiga potentiella egenskaper hos statistik inkluderar fullständighet , konsistens , tillräcklighet , opartiskhet , minsta genomsnittliga kvadratfel , låg varians , robusthet och beräkningskomfort.

Information om en statistik

Information om en statistik om modellparametrar kan definieras på flera sätt. Den vanligaste är Fisher -informationen , som definieras på statistikmodellen som induceras av statistiken. Kullback -informationsmått kan också användas.

Se även

Referenser

  • Kokoska, Stephen (2015). Inledande statistik: Ett problemlösande tillvägagångssätt (andra upplagan). New York: WH Freeman and Company. ISBN 978-1-4641-1169-3.
  • Parker, Sybil P (chefredaktör). "Statistisk". McGraw-Hill Dictionary of Scientific and Technical terms. Femte upplagan. McGraw-Hill, Inc. 1994. ISBN  0-07-042333-4 . Sida 1912.
  • DeGroot och Schervish. "Definition av en statistik". Sannolikhet och statistik. International Edition. Tredje upplagan. Addison Wesley. 2002. ISBN  0-321-20473-5 . Sidorna 370 till 371.
  1. ^ Kokoska 2015 , sid. 296-308.
  2. ^ Kokoska 2015 , sid. 296-297.