Klinisk signifikans - Clinical significance

Inom medicin och psykologi är klinisk betydelse den praktiska betydelsen av en behandlingseffekt - oavsett om den har en verklig, påtaglig, märkbar effekt på det dagliga livet.

Typer av betydelse

Statistisk signifikans

Statistisk signifikans används vid hypotesprovning , där nollhypotesen (att det inte finns något samband mellan variabler ) testas. En nivå av betydelse väljs (oftast α = 0,05 eller 0,01), vilket innebär sannolikheten att felaktigt avvisa en sann nollhypotes. Om det finns en signifikant skillnad mellan två grupper vid α = 0,05 betyder det att det bara är 5% sannolikhet att uppnå de observerade resultaten under antagandet att skillnaden helt beror på slumpen (dvs nollhypotesen är sann); det ger ingen indikation på skillnadens storlek eller kliniska betydelse. När statistiskt signifikanta resultat uppnås föredrar de avvisning av nollhypotesen, men de bevisar inte att nollhypotesen är falsk. På samma sätt bevisar icke-signifikanta resultat inte att nollhypotesen är sann; de ger heller inga bevis för sanningen eller falskheten i hypotesen som forskaren har genererat. Statistisk betydelse avser endast kompatibiliteten mellan observerade data och vad som kan förväntas under antagandet att nollhypotesen är sann.

Praktisk betydelse

Vid bred användning svarar den "praktiska kliniska betydelsen" på frågan, hur effektivt är interventionen eller behandlingen, eller hur mycket förändring orsakar behandlingen. När det gäller testning av kliniska behandlingar ger praktisk betydelse optimalt kvantifierad information om vikten av ett resultat, med hjälp av mått som effektstorlek , antal som behövs för att behandla (NNT) och förebyggande fraktion . Praktisk betydelse kan också förmedla halvkvantitativa, jämförande eller genomförbarhetsbedömningar av nyttan.

Effektstorlek är en typ av praktisk betydelse. Den kvantifierar i vilken utsträckning ett urval skiljer sig från förväntningarna. Effektstorlek kan ge viktig information om resultaten av en studie och rekommenderas för inkludering utöver statistisk signifikans. Effektstorlekar har sina egna källor till förspänning, kan komma att förändras baserat på populationsvariabilitet hos den beroende variabeln och tenderar att fokusera på gruppeffekter, inte enskilda förändringar.

Även om klinisk betydelse och praktisk betydelse ofta används synonymt betecknar en mer teknisk begränsande användning detta som felaktigt. Denna tekniska användning inom psykologi och psykoterapi är inte bara en följd av en noggrant ritad precision och specificitet i språket, utan möjliggör en perspektivförskjutning från gruppeffekter till förändring (ar) hos en individ.

Specifik användning

Däremot ger den kliniska betydelsen information om huruvida en behandling var tillräckligt effektiv för att ändra en patients diagnostiska märkning när den används som en teknisk term inom psykologi och psykoterapi. När det gäller kliniska behandlingsstudier svarar klinisk betydelse på frågan "Är en behandling tillräckligt effektiv för att patienten ska bli normal [med avseende på diagnostiska kriterier i fråga]?"

En behandling kan till exempel förändra depressiva symtom signifikant (statistisk signifikans), förändringen kan vara en stor minskning av depressiva symtom (praktisk signifikans- effektstorlek) och 40% av patienterna uppfyllde inte längre de diagnostiska kriterierna för depression (klinisk signifikans) ). Det är mycket möjligt att ha en behandling som ger en signifikant skillnad och medelstora eller stora effektstorlekar, men som inte flyttar en patient från dysfunktionell till funktionell.

Inom psykologi och psykoterapi föreslogs först klinisk betydelse av Jacobson, Follette och Revenstorf som ett sätt att svara på frågan, är en terapi eller behandling tillräckligt effektiv så att en klient inte uppfyller kriterierna för en diagnos? Jacobson och Truax definierade senare klinisk betydelse som "i vilken utsträckning terapi rör någon utanför räckvidden för den dysfunktionella befolkningen eller inom ramen för den funktionella befolkningen." De föreslog två komponenter i detta förändringsindex: status för en patient eller klient efter att behandlingen har slutförts och "hur mycket förändring som har skett under behandlingen."

Klinisk betydelse är också en övervägande när man tolkar resultaten av en persons psykologiska bedömning . Ofta kommer det att finnas en skillnad i poäng eller underfrekvenser som är statistiskt signifikanta , som troligen inte har inträffat enbart av en slump. Men inte alla dessa statistiskt signifikanta skillnader är kliniskt signifikanta genom att de varken förklarar befintlig information om klienten eller ger användbar vägledning för intervention. Skillnader som är små i storlek saknar vanligtvis praktisk relevans och är osannolikt att de är kliniskt signifikanta. Skillnader som är vanliga i befolkningen är sannolikt inte kliniska signifikanta, eftersom de helt enkelt kan återspegla en nivå av normal mänsklig variation. Dessutom letar kliniker efter information i bedömningsdata och klientens historia som bekräftar relevansen av den statistiska skillnaden, för att fastställa sambandet mellan prestanda på det specifika testet och individens mer allmänna funktion.

Beräkning av klinisk betydelse

Precis som det finns många sätt att beräkna statistisk signifikans och praktisk betydelse, finns det en mängd olika sätt att beräkna klinisk signifikans. Fem vanliga metoder är Jacobson-Truax-metoden, Gulliksen-Lord-Novick-metoden, Edwards-Nunnally-metoden, Hageman-Arrindell-metoden och hierarkisk linjär modellering.

Jacobson-Truax

Jacobson-Truax är en vanlig metod för att beräkna klinisk betydelse. Det handlar om att beräkna ett Reliability Change Index (RCI). RCI är lika med skillnaden mellan deltagarens pre-test och post-test poäng, dividerat med standardfelet för skillnaden. Cutoff-poäng fastställs för att placera deltagarna i en av fyra kategorier: återhämtade sig, förbättrades, oförändrade eller försämrades, beroende på riktningen för RCI och om cutoff-poängen uppnåddes.

Gulliksen-Lord-Novick

Gulliksen-Lord-Novick-metoden liknar Jacobson-Truax, förutom att den tar hänsyn till regression till medelvärdet . Detta görs genom att subtrahera för- och eftertestresultaten från ett populationsmedelvärde och dividera med standardavvikelsen för befolkningen.

Edwards-Nunnally

Edwards-Nunnally-metoden för beräkning av klinisk betydelse är ett strängare alternativ till Jacobson-Truax-metoden. Tillförlitlighetspoäng används för att föra pre-testpoängen närmare medelvärdet, och sedan utvecklas ett konfidensintervall för denna justerade pre-testpoäng. Konfidensintervall används vid beräkning av förändringen från för-test till post-test, så större faktisk förändring i poäng är nödvändig för att visa klinisk betydelse jämfört med Jacobson-Truax-metoden.

Hageman-Arrindell

Hageman-Arrindell-beräkningen av klinisk betydelse innefattar index för gruppförändring och individuell förändring. Tillförlitligheten hos förändring indikerar om en patient har förbättrats, varit densamma eller försämrats. Ett andra index, den kliniska betydelsen av förändring, indikerar fyra kategorier som liknar de som används av Jacobson-Truax: försämrad, inte tillförlitligt förändrad, förbättrad men inte återhämtad och återhämtad.

Hierarkisk linjär modellering (HLM)

HLM innebär tillväxtkurvanalys istället för jämförelser före test efter test, så tre datapunkter behövs från varje patient, istället för endast två datapunkter (för-test och efter-test). Ett datorprogram, såsom hierarkisk linjär och icke-linjär modellering, används för att beräkna förändringsuppskattningar för varje deltagare. HLM möjliggör också analys av tillväxtkurvmodeller för dyader och grupper.

Se även

Referenser