Ranking - Ranking

En rangordning är ett förhållande mellan en uppsättning artiklar så att för två objekt är det första antingen "rankat högre än", "rankat lägre än" eller "rankat lika med" det andra. I matematik är detta känt som en svag ordning eller total förbeställning av objekt. Det är inte nödvändigtvis en total ordning på objekt eftersom två olika objekt kan ha samma rangordning. Själva rankingen är helt ordnad. Till exempel är material helt förbeställda av hårdhet , medan hårdhetsgrader är helt ordnade. Om två artiklar är lika i rang anses det vara oavgjort.

Genom att reducera detaljerade mått till en sekvens av ordinalnummer gör rankningar det möjligt att utvärdera komplex information enligt vissa kriterier. Således kan till exempel en internetsökmotor rangordna sidorna som den hittar enligt en uppskattning av deras relevans , vilket gör det möjligt för användaren att snabbt välja de sidor som de sannolikt kommer att vilja se.

Analys av data som erhållits genom rangordning kräver vanligtvis icke-parametrisk statistik .

Strategier för att tilldela rankningar

Det är inte alltid möjligt att tilldela rankningar unikt. Till exempel kan två (eller flera) deltagare i ett lopp eller en tävling spela om en plats på rankningen. Vid beräkning av en ordinalmätning kan två (eller flera) av de kvantiteter som rankas mäta lika. I dessa fall kan en av de strategier som visas nedan för att tilldela rankningarna antas. Ett vanligt stenografi sätt att skilja dessa rankningsstrategier på är genom de rankningsnummer som skulle produceras för fyra artiklar, med den första posten rankad före den andra och tredje (som jämför lika) som båda rankas före den fjärde. Dessa namn visas också nedan.

Standard tävlingsrankning ("1224" ranking)

I tävlingsrankning får artiklar som jämför lika samma rankningsnummer, och sedan lämnas en lucka i rankningsnumren. Antalet rankningsnummer som utelämnas i detta gap är ett färre än antalet objekt som jämförde lika. På motsvarande sätt är varje artikels rankningsnummer 1 plus antalet artiklar rankade ovanför det. Denna rankningsstrategi används ofta för tävlingar, eftersom det betyder att om två (eller flera) tävlande slår om en position på rankningen, är positionen för alla de som är rankade under dem opåverkad (dvs en konkurrent kommer bara tvåa om exakt en person poäng bättre än dem, tredje om exakt två personer gör bättre än dem, fjärde om exakt tre personer gör bättre poäng än dem, etc.).

Således om A rankas före B och C (som jämför lika) som båda är rankade före D, då får A ranking nummer 1 ("först"), B får ranking nummer 2 ("gemensam andra"), C får också ranking nummer 2 ("gemensam andra") och D får ranking nummer 4 ("fjärde").

Ändrad tävlingsrankning ("1334" ranking)

Ibland görs tävlingsrankning genom att lämna luckorna i rankningsnumren före uppsättningarna med lika rankade artiklar (snarare än efter dem som i standardtävlingsrankning). Antalet rankningsnummer som utelämnas i detta gap är fortfarande ett färre än antalet objekt som jämförde lika. På motsvarande sätt är varje artikels rankningsnummer lika med antalet objekt rankade lika med det eller över det. Denna rangordning säkerställer att en konkurrent bara kommer tvåa om den får högre poäng än alla sina motståndare utom en, tredje om den gör högre än alla utom två av sina motståndare, etc.

Således om A rankas före B och C (som jämför lika) som båda rankas som chef för D, då får A ranking nummer 1 ("först"), B får ranking nummer 3 ("gemensam tredjedel"), C får också ranking nummer 3 ("gemensam tredje") och D får ranking nummer 4 ("fjärde"). I det här fallet skulle ingen få rankning nummer 2 ("andra") och det skulle lämnas som en lucka.

Tät ranking ("1223" ranking)

I tät ranking får artiklar som jämför lika mycket samma rankningsnummer, och nästa objekt får omedelbart följande rankningsnummer. På motsvarande sätt är varje artikels rankningsnummer 1 plus antalet artiklar rankade ovanför det som är olika med avseende på rangordning.

Således om A rankas före B och C (som jämför lika) som båda är rankade före D, då får A ranking nummer 1 ("först"), B får ranking nummer 2 ("gemensam andra"), C får också ranking nummer 2 ("gemensam andra") och D får ranking nummer 3 ("Tredje").

Ordinarie ranking ("1234" ranking)

I ordinarie rangordning får alla artiklar distinkta ordinalnummer, inklusive artiklar som jämför lika. Tilldelning av distinkta ordinalnummer till objekt som jämför lika kan göras slumpmässigt eller godtyckligt, men det är i allmänhet att föredra att använda ett system som är godtyckligt men konsekvent, eftersom detta ger stabila resultat om rankningen görs flera gånger. Ett exempel på ett godtyckligt men konsekvent system skulle vara att införliva andra attribut i rankningsordningen (t.ex. alfabetisk ordning av konkurrentens namn) för att säkerställa att inga två objekt matchar exakt.

Med denna strategi, om A rankas före B och C (som jämför lika) som båda är rankade före D, då får A ranking nummer 1 ("först") och D får ranking nummer 4 ("fjärde"), och antingen B får ranking nummer 2 ("andra") och C får ranking nummer 3 ("tredje") eller C får ranking nummer 2 ("andra") och B får ranking nummer 3 ("tredje").

I databehandlingen kallas ordinarie rangordning också som "radnummerering".

Fraktionell rangordning ("1 2,5 2,5 4" ranking)

Objekt som jämför lika får samma rankningsnummer, vilket är medelvärdet av vad de skulle ha under ordinarie rankningar; på motsvarande sätt rankas antalet 1 plus antalet artiklar rankade ovanför det plus hälften av antalet objekt som är lika med det. Denna strategi har egenskapen att summan av rankningsnumren är densamma som under ordinarie rangordning. Av denna anledning används den vid beräkning av Borda -räkningar och i statistiska tester (se nedan).

Således om A rankas före B och C (som jämför lika) som båda är rankade före D, då får A ranking nummer 1 ("först"), B och C får var och en rankning nummer 2,5 (genomsnitt av "gemensam andra/tredje ") och D får rankning nummer 4 (" fjärde ").

Här är ett exempel: Antag att du har datamängden 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.

Ordinarie led är 1, 2, 3, 4, 5, 6, 7, 8, 9.

För v = 1.0 är fraktionsrankan genomsnittet av ordinalraden: (1 + 2) / 2 = 1,5. På liknande sätt, för v = 5.0, är ​​fraktionsrankan (7 + 8 + 9) / 3 = 8.0.

Således är fraktionerade led: 1,5, 1,5, 3,0, 4,5, 4,5, 6,0, 8,0, 8,0, 8,0

Rankning i statistik

I statistik är ranking den datatransformation där numeriska eller ordinala värden ersätts med deras rang när data sorteras. Till exempel observeras de numeriska data 3.4, 5.1, 2.6, 7.3, raden av dessa dataobjekt skulle vara 2, 3, 1 och 4. Till exempel skulle ordinära data varm, kall, varm ersättas med 3, 1, 2. I dessa exempel tilldelas ledvärdena i stigande ordning. (I vissa andra fall används fallande grader.) Rader är relaterade till den indexerade listan över orderstatistik , som består av den ursprungliga datamängden som ordnats om i stigande ordning.

Vissa typer av statistiska tester använder beräkningar baserade på grader. Exempel inkluderar:

Värdefördelningen i minskande rangordning är ofta av intresse när värdena varierar mycket i skala; detta är rangstorleksfördelningen (eller rangfrekvensfördelningen), till exempel för stadsstorlekar eller ordfrekvenser. Dessa följer ofta en maktlag .

Vissa led kan ha icke-heltal för bundna datavärden. Till exempel, när det finns ett jämnt antal kopior av samma datavärde, slutar den ovan beskrivna bråkstatistiska rankningen av de bundna data i ½. Percentilrankning är en annan typ av statistisk rangordning.

Rangfunktion i Excel

Microsoft Excel tillhandahåller två rankningsfunktioner, Rank.EQ -funktionen som tilldelar tävlingsrader ("1224") och Rank.AVG -funktionen som tilldelar fraktionerade rangordningar ("1 2,5 2,5 4") enligt beskrivningen ovan. Funktionerna har ordningsargumentet , som som standard är inställt på fallande , dvs det största antalet kommer att ha en rang 1. Detta är i allmänhet ovanligt för statistik där rankningen vanligtvis är i stigande ordning, där det minsta antalet har en rang 1.

Jämförelse av rankningar

En rangkorrelation kan användas för att jämföra två rankningar för samma uppsättning objekt. Till exempel är Spearmans rangkorrelationskoefficient användbar för att mäta det statistiska beroendet mellan rankningar för idrottare i två turneringar. Och Kendall rank korrelationskoefficienten är ett annat tillvägagångssätt. Alternativt erbjuder korsnings-/överlappningsbaserade tillvägagångssätt ytterligare flexibilitet. Ett exempel är tillvägagångssättet "Rank -rank hypergeometrisk överlappning", som är utformat för att jämföra rankningen av generna som är "överst" i två ordnade listor med differentiellt uttryckta gener. Ett liknande tillvägagångssätt används av "Rank Biased Overlap (RBO)", som också implementerar en justerbar sannolikhet, p, för att anpassa vikten som tilldelas till ett önskat rangdjup. Dessa tillvägagångssätt har fördelarna med att ta itu med oskiljda uppsättningar , uppsättningar av olika storlekar och toppviktning (med hänsyn tagen till den absoluta rankningspositionen, vilket kan ignoreras i vanliga icke-viktade rangkorrelationsmetoder).

Ansökningar

Ranking och socioekonomisk utvärdering

Rangmetoden baserad på vissa specifika index är ett av de vanligaste systemen som används av beslutsfattare och internationella organisationer för att bedöma ländernas socioekonomiska sammanhang. Några anmärkningsvärda exempel är: Human Development Index (United Nations), Doing Business Index (World Bank), Corruption Perceptions Index (Transparency International) och Index of Economic Freedom (Heritage Foundation). Exempelvis mäter Världsbankens Doing Business -indikator affärsregler och verkställighet i 190 länder. Länder rankas efter 10 indikatorer som är syntetiserade för att producera den slutliga rankningen. Varje indikator består av delindikatorer; Till exempel består registreringsfastighetsindikatorn av fyra delindikatorer som mäter tid, procedurer, kostnader och kvalitet på markregistreringssystemet. Uppenbarligen är denna typ av grader baserade på subjektiva kriterier för att tilldela poängen. Ibland kan de antagna parametrarna ge avvikelser med de empiriska observationerna, därför kan potentiella fördomar och paradox komma fram från tillämpningen av dessa kriterier.

Ranking som ett socialt spel

Att vara konkurrenskraftig är människans natur. Lusten att uppnå en högre social rang kan uppfattas som en drivkraft för människor. Enkelt uttryckt vill vi veta vem som är rikast, smartast, snyggast eller snyggast. Vi rankas också ibland av andra: våra handledare, våra grannar och jämför vår status i samhället med andras. En oundviklig fråga är hur objektiva eller subjektiva dessa rankningar är? Många rankade listor är baserade på subjektiv kategorisering. Vi kan till och med ställa frågan: vill vi alltid synas objektivt, eller snarare inte ha något emot att ha en bättre bild än vi förtjänar? Det finns verkligen specifika svårigheter att mäta samhället. För att hitta vår plats i verkliga och virtuella samhällen måste vi förstå de frågor som uppstår när vi navigerar mellan objektivitet och subjektivitet genom att kombinera mänsklig och artificiell intelligens. Uppsättningen av ämnen för att behandla dessa ämnen inkluderar jämförelse, ranking, betyg, val, lagar, rankningsspel, kamp för rykte, etc. (se Péter Érdi).

Andra exempel

Se även

Referenser

externa länkar