Strikt standardiserad medelskillnad - Strictly standardized mean difference

I statistiken är den strikt standardiserade medelskillnaden (SSMD) ett mått på effektstorlek . Det är medelvärdet dividerat med standardavvikelsen för en skillnad mellan två slumpmässiga värden var och en från en av två grupper. Det föreslogs ursprungligen för kvalitetskontroll och val av träffar vid screening med hög genomströmning (HTS) och har blivit en statistisk parameter som mäter effektstorlekar för jämförelse av två grupper med slumpmässiga värden.

Bakgrund

Vid screening med hög genomströmning (HTS) är kvalitetskontroll (QC) avgörande. En viktig QC karakteristik i ett HTS -analysen är hur mycket de positiva kontrollerna, testföreningar , och negativa kontroller skiljer sig från varandra. Denna QC -egenskap kan utvärderas med hjälp av jämförelse av två brunnstyper i HTS -analyser . Signal-brus-förhållande (S/N), signal-till-bakgrund-förhållande (S/B) och Z-faktorn har antagits för att utvärdera kvaliteten på HTS- analyser genom jämförelse av två undersökta typer av brunnar. S/B tar dock inte hänsyn till någon information om variabilitet; och S/N kan fånga variabiliteten endast i en grupp och kan därför inte bedöma analysens kvalitet när de två grupperna har olika variabler. Zhang JH et al. föreslog Z-faktorn . Fördelen med Z-faktorn framför S/N och S/B är att den tar hänsyn till variationerna i båda jämförda grupperna. Som ett resultat har Z-faktorn i stort sett använts som ett QC-mått i HTS-analyser. Det absoluta tecknet i Z-faktorn gör det obekvämt att härleda sin statistiska slutsats matematiskt.

För att härleda en bättre tolkbar parameter för att mäta differentieringen mellan två grupper föreslog Zhang XHD SSMD att utvärdera differentieringen mellan en positiv kontroll och en negativ kontroll i HTS -analyser. SSMD har en sannolikhetsgrund på grund av dess starka koppling till d + -sannolikhet (dvs. sannolikheten för att skillnaden mellan två grupper är positiv). Till viss del motsvarar d + -sannolikheten det väletablerade sannolikhetsindexet P ( X  >  Y ) som har studerats och tillämpats inom många områden. Med stöd av sin sannolikhetsgrund har SSMD använts för både kvalitetskontroll och val av träffar vid screening med hög genomströmning.

Begrepp

Statistisk parameter

Som en statistisk parameter definieras SSMD (betecknad som ) som förhållandet mellan medelvärde och standardavvikelse för skillnaden mellan två slumpmässiga värden respektive från två grupper. Antag att en grupp med slumpmässiga värden har medelvärde och varians och en annan grupp har medelvärde och varians . Den kovarians mellan de två grupperna är Därefter SSMD för jämförelse av dessa två grupper definieras som

Om de två grupperna är oberoende,

Om de två oberoende grupperna har lika stora skillnader ,

I situationen där de två grupperna är korrelerade är en vanligt förekommande strategi för att undvika beräkning av först att erhålla parade observationer från de två grupperna och sedan att uppskatta SSMD baserat på de parade observationerna. Baserat på en parad skillnad med befolknings medelvärde och är SSMD

Statistisk uppskattning

I situationen där de två grupperna är oberoende härledde Zhang XHD uppskattningen av maximal sannolikhet (MLE) och moment-metod (MM) för SSMD. Antag att grupperna 1 och 2 har prov medelvärde , och prov avvikelser . MM -uppskattningen av SSMD är då

När de två grupperna har normalfördelningar med lika varians , är den enhetligt minimala variansen objektiv uppskattning (UMVUE) av SSMD,

var är provstorlekarna i de två grupperna och .

I den situation där de två grupperna är korrelerade, baserat på ett parat skillnad med en provstorlek , prov medelvärde och prov varians , är MM uppskattning av SSMD

UMVUE -uppskattningen av SSMD är

SSMD liknar t-statistik och Cohens d, men de är olika med varandra som illustreras i.

Ansökan i analyser med hög genomströmning

SSMD är förhållandet mellan medelvärdet och standardavvikelsen för skillnaden mellan två grupper. När data förbehandlas med loggtransformation som vi normalt gör i HTS-experiment, är SSMD medelvärdet för loggveckändring dividerat med standardavvikelsen för loggvikningsändring med avseende på en negativ referens. Med andra ord är SSMD den genomsnittliga vikningsförändringen (på loggskalan) som straffas av variationen i vikningsändringen (på loggskalan). För kvalitetskontroll är ett index för kvaliteten på en HTS -analys storleken på skillnaden mellan en positiv kontroll och en negativ referens i en analysplatta . För träffval representeras storleken på effekterna av en förening (dvs en liten molekyl eller ett siRNA ) av storleken på skillnaden mellan föreningen och en negativ referens. SSMD mäter direkt skillnaden mellan två grupper. Därför kan SSMD användas för både kvalitetskontroll och slagval i HTS -experiment.

Kvalitetskontroll

Antalet brunnar för de positiva och negativa kontrollerna i en platta i plattformen med 384 brunnar eller 1536 brunnar är normalt utformad för att vara någorlunda stor. Antag att de positiva och negativa kontroller i en platta har prov medelvärde , prov avvikelser och urvalsstorlekar . Vanligtvis håller antagandet att kontrollerna har lika stor variation i en platta. I ett sådant fall uppskattas SSMD för bedömning av kvalitet i plattan som

var . När antagandet om lika variation inte håller, uppskattas SSMD för bedömning av kvalitet i den plattan som

Om det finns tydliga avvikelser i kontrollerna kan SSMD uppskattas till

var är medianerna och median absoluta avvikelser i de positiva respektive negativa kontrollerna.

Det Z- faktorbaserade QC-kriteriet används populärt i HTS-analyser. Det har emellertid visats att detta QC -kriterium är mest lämpligt för en analys med mycket eller extremt starka positiva kontroller. I en RNAi HTS -analys är en stark eller måttlig positiv kontroll vanligtvis mer lärorik än en mycket eller extremt stark positiv kontroll eftersom effektiviteten av denna kontroll mer liknar träffar av intresse. Dessutom har de positiva kontrollerna i de två HTS -experimenten teoretiskt sett olika effekter. Följaktligen bör QC -trösklarna för den måttliga kontrollen skilja sig från dem för den starka kontrollen i dessa två experiment. Vidare är det vanligt att två eller flera positiva kontroller antas i ett enda experiment. Att tillämpa samma Z -faktorbaserade QC -kriterier på båda kontrollerna leder till inkonsekventa resultat som illustreras i litteraturen.

De SSMD-baserade QC-kriterierna som anges i följande tabell tar hänsyn till effektstorleken för en positiv kontroll i en HTS-analys där den positiva kontrollen (t.ex. en inhiberingskontroll) teoretiskt har värden som är mindre än den negativa referensen.

Kvalitetstyp A: Måttlig kontroll B: Stark kontroll C: Mycket stark kontroll D: Extremt stark kontroll
Excellent
Bra
Sämre
Fattig

I tillämpningen, om effektstorleken för en positiv kontroll är känd biologiskt, anta motsvarande kriterium baserat på denna tabell. I annat fall bör följande strategi hjälpa till att avgöra vilket QC -kriterium som ska tillämpas: (i) i många småmolekylära HTS -analyser med en positiv kontroll bör vanligtvis kriterium D (och ibland kriterium C) antas eftersom denna kontroll vanligtvis har mycket eller extremt mycket starka effekter; (ii) för RNAi HTS -analyser där cellviabiliteten är det uppmätta svaret, bör kriterium D antas för kontrollerna utan celler (nämligen brunnarna utan tillsatta celler) eller bakgrundskontroller; (iii) i en viral analys där mängden virus i värdceller är intressant, används vanligtvis kriterium C och kriterium D används ibland för den positiva kontrollen som består av siRNA från viruset.

Liknande SSMD-baserade QC-kriterier kan konstrueras för en HTS-analys där den positiva kontrollen (t.ex. en aktiveringskontroll) teoretiskt har värden större än den negativa referensen. Mer information om hur du tillämpar SSMD-baserade QC-kriterier i HTS-experiment finns i en bok.

Slå markering

I en HTS -analys är ett primärt mål att välja föreningar med en önskad storlek av inhibering eller aktiveringseffekt. Storleken av föreningen effekten representeras av storleken hos skillnaden mellan en testförening och en negativ referensgrupp med inga specifika hämning / aktiveringseffekter. En förening med önskad effektstorlek i en HTS -skärm kallas en träff. Processen att välja träffar kallas träffval. Det finns två huvudstrategier för att välja träffar med stora effekter. Ett är att använda vissa metriska (s) till rang och / eller klassificera föreningar genom deras effekter och sedan för att välja det största antalet potenta föreningar som är praktisk för validerings analyser . Den andra strategin är att testa om en förening har effekter som är tillräckligt starka för att nå en förinställd nivå. I denna strategi måste falsknegativa räntor (FNR) och/eller falskt positiva räntor (FPR) kontrolleras.

SSMD kan inte bara rangordna effekterna utan också klassificera effekter som visas i följande tabell baserat på SSMD: s populationsvärde ( ).

Effekt subtyp Trösklar för negativ SSMD Trösklar för positiv SSMD
Extremt stark
Väldigt stark
Stark
Ganska stark
Måttlig
Ganska måttligt
Ganska svag
Svag
Väldigt svag
Extremt svag
Ingen effekt

Uppskattningen av SSMD för skärmar utan replikat skiljer sig från den för skärmar med replikat.

I en primär skärm utan replikat, om man antar det uppmätta värdet (vanligtvis på log-skala) i en brunn för en testad förening är och den negativa referens av att plattan har provstorlek , prov medelvärde , median , standardavvikelse och median absolut avvikelse , den SSMD för denna förening uppskattas till

var . När det finns outliers i en analys som vanligtvis är vanlig i HTS -experiment kan en robust version av SSMD erhållas med

I en bekräftande eller primär screening med replikat, för den i: e testföreningen med replikat, beräknar vi den parade skillnaden mellan det uppmätta värdet (vanligtvis på log-skala) av föreningen och medianvärdet för en negativ kontroll i en platta, erhåll sedan medelvärdet och variansen för den parade skillnaden över replikat. SSMD för denna förening uppskattas till

I många fall kan forskare använda både SSMD och genomsnittlig vikningsändring för träffval i HTS -experiment. Den dubbla ficklampa plot kan visa både genomsnittliga faldig förändring och SSMD för alla testföreningar i en analys och bidra till att integrera dem båda för att välja hits i HTS experiment. Användningen av SSMD för träffval i HTS-experiment illustreras steg för steg

Se även

Vidare läsning

Referenser