Bayesian experimentell design - Bayesian experimental design

Bayesian experimentell design ger en allmän sannolikhetsteoretisk ram från vilken andra teorier om experimentell design kan härledas. Det är baserat på Bayesian slutsats att tolka observationer / data som förvärvats under experimentet. Detta gör det möjligt att redovisa både förkunskaper om parametrarna och osäkerheter i observationer.

Teorin om Bayesiansk experimentell design bygger till viss del på teorin för att fatta optimala beslut under osäkerhet . Målet när man utformar ett experiment är att maximera den förväntade nyttan av experimentets resultat. Verktyget definieras oftast i termer av ett mått på noggrannheten i den information som tillhandahålls av experimentet (t.ex. Shannon-informationen eller negativa av variansen ), men kan också involvera faktorer som den ekonomiska kostnaden för att utföra experimentet. Vilken som är den optimala experimentdesignen beror på det specifika användarkriterium som valts.

Relationer till mer specialiserad optimal designteori

Linjär teori

Om modellen är linjär är den tidigare sannolikhetsdensitetsfunktionen (PDF) homogen och observationsfel normalt fördelade , förenklas teorin till den klassiska optimala experimentella designteorin .

Ungefärlig normalitet

I många publikationer om Bayesian experimentell design antas det (ofta implicit) att alla bakre PDF-filer är ungefärliga. Detta gör det möjligt att beräkna det förväntade verktyget med hjälp av linjär teori, medelvärde över utrymmet för modellparametrar, en metod som granskats i Chaloner & Verdinelli (1995) . Försiktighet måste dock tas vid tillämpning av denna metod, eftersom ungefärlig normalitet för alla möjliga posterior är svår att verifiera, även i fall av normala observationsfel och enhetlig tidigare PDF.

Bakre fördelning

Nyligen möjliggör ökade beräkningsresurser slutsatser om den bakre fördelningen av modellparametrar, som direkt kan användas för experimentdesign. Vanlier et al. (2012) föreslog ett tillvägagångssätt som använder den bakre prediktiva fördelningen för att bedöma effekten av nya mätningar på förutsägelsosäkerhet, medan Liepe et al. (2013) föreslår att man maximerar den ömsesidiga informationen mellan parametrar, förutsägelser och potentiella nya experiment.

Matematisk formulering

Notation
parametrar som ska bestämmas
observation eller data
design
PDF för att göra observation , givna parametervärden och design
tidigare PDF
marginal PDF i observationsutrymme
   bakre PDF
   nyttan av designen
   nyttan av experimentets resultat efter observation med design

Med en vektor av parametrar att bestämma, en tidigare PDF över dessa parametrar och en PDF för att göra observation , givna parametervärden och en experimentdesign , kan den bakre PDF-filen beräknas med Bayes sats

var är den marginella sannolikhetstätheten i observationsutrymmet

Den förväntade nyttan av ett experiment med design kan sedan definieras

var är någon verkligt värderad funktion av den bakre PDF-filen efter att ha gjort observation med hjälp av en experimentdesign .

Få in Shannon-information som verktyg

Utility kan definieras som den tidigare bakre vinsten i Shannon-information

En annan möjlighet är att definiera verktyget som

den Kullback-Leibler divergens enligt den kända från den bakre distribution. Lindley (1956) noterade att det förväntade verktyget då kommer att vara koordinatoberoende och kan skrivas i två former

varav den senare kan utvärderas utan att man behöver utvärdera enskilda bakre PDF-filer för alla möjliga observationer . Det är värt att notera att den första termen på den andra ekvationslinjen inte beror på designen , så länge observationsosäkerheten inte gör det. Å andra sidan är integralen av i den första formen konstant för alla , så om målet är att välja design med högsta nytta behöver termen inte beräknas alls. Flera författare har övervägt numeriska tekniker för att utvärdera och optimera detta kriterium, t.ex. van den Berg, Curtis & Trampert (2003) och Ryan (2003) . Anteckna det

den förväntade informationsvinsten är exakt den ömsesidiga informationen mellan parametern θ och observationen y . Ett exempel på Bayesian design för linjär dynamisk modelldiskriminering ges i Bania (2019) . Eftersom det var svårt att beräkna har dess nedre gräns använts som en verktygsfunktion. Den nedre gränsen maximeras sedan under signalens energibegränsning. Föreslagen Bayesian-design har också jämförts med klassisk genomsnittlig D-optimal design. Det visades att den Bayesianska designen är överlägsen D-optimal design.

Den Kelly kriteriet beskriver också en sådan nyttofunktion för en spelare som vill maximera vinsten, som används i spel och informationsteori ; Kellys situation är identisk med det föregående, med sidinformation eller "privat tråd" som tar platsen för experimentet.


Se även

Referenser

  • Vanlier; Tiemann; Hilbers; van Riel (2012), "A Bayesian approach to target experiment design", Bioinformatics , 28 (8): 1136–1142, doi : 10.1093 / bioinformatics / bts092 , PMC  3324513 , PMID  22368245
  • Lindley, DV (1956), "On a measure of information given by an experiment", Annals of Mathematical Statistics , 27 (4): 986–1005, doi : 10.1214 / aoms / 1177728069