Bevarade signaturindels - Conserved signature indels

Bevarade signaturinsatser och raderingar ( CSI ) i proteinsekvenser ger en viktig kategori av molekylära markörer för att förstå fylogenetiska samband. CSI, orsakade av sällsynta genetiska förändringar, tillhandahåller användbara fylogenetiska markörer som generellt har en definierad storlek och de flankeras på båda sidor av bevarade regioner för att säkerställa deras tillförlitlighet. Medan indeler kan vara godtyckliga insatser eller raderingar, definieras CSI: er endast de proteinindeler som finns i konserverade regioner av proteinet.

CSI som är begränsade till en viss klad eller grupp av arter, i allmänhet ger goda fylogenetiska markörer av gemensamt evolutions härkomst. På grund av sällsynta och mycket specifika natur hos sådana förändringar är det mindre troligt att de kan uppstå oberoende av antingen konvergent eller parallell utveckling (dvs homoplasi) och därför sannolikt kommer att representera synapomorfi . Andra förvirrande faktorer som skillnader i evolutionära hastigheter på olika platser eller bland olika arter påverkar i allmänhet inte heller tolkningen av ett CSI. Genom att bestämma närvaron eller frånvaron av CSI i en grupp utanför gruppen kan man dra slutsatsen om CSI: s förfäder var en insats eller radering och detta kan användas för att utveckla ett rotat fylogenetiskt förhållande mellan organismer.

De flesta CSI: er som har identifierats har visat sig uppvisa högt prediktivt värde och de behåller i allmänhet specificiteten för de ursprungligen identifierade arterna. Baserat på deras närvaro eller frånvaro bör det därför vara möjligt att identifiera både kända och till och med tidigare okända arter som tillhör dessa grupper i olika miljöer.

Typer

Gruppspecifik

Figur 1: Exempel på en gruppspecifik Conserved signature indel (CSI), som är specifik för arter från taxon X. Streckarna i uppställningarna indikerar förekomsten av en aminosyra som är identisk med den på översta raden.

Gruppspecifika CSI delas vanligen av olika arter som tillhör en viss Taxon (t.ex. släkte, familj, klass, ordning, phylum) men de finns inte i andra grupper. Dessa CSI introducerades troligtvis i en förfader till gruppen av arter innan taxamedlemmarna divergerade. De tillhandahåller molekylära medel för att skilja medlemmar i en viss taxon från alla andra organismer.

Figur 1 visar ett exempel på 5aa CSI som finns i alla arter som tillhör taxon X. Detta är en särskiljande egenskap hos denna taxon eftersom den inte finns i någon annan art. Denna signatur introducerades sannolikt i en gemensam förfader till arten från denna taxon. På samma sätt kan andra gruppspecifika signaturer (visas inte) delas av antingen A1 och A2 eller B1 och B2, etc., eller till och med av X1 och X2 eller av X3 och X4, etc. Grupperna A, B, C, D och X, i det här diagrammet kan motsvara olika bakteriella eller eukaryota fyla.

Gruppspecifika CSI har tidigare använts för att bestämma det fylogenetiska sambandet mellan ett antal bakteriella phyla och undergrupper inom det. Till exempel delades en insats med 3 aminosyror unikt av medlemmar av phylum Thermotogae i det essentiella 50S-ribosomproteinet L7/L12 , inom en mycket konserverad region (82-124 aminosyra). Detta finns inte hos några andra bakteriearter och kan användas för att karakterisera medlemmar av phylum Thermotogae från alla andra bakterier. Gruppspecifika CSI användes också för att karakterisera undergrupper inom phylum Thermotogae .

Multigrupp eller huvudlinje

Figur 2: Multi group eller Main-Line Conserved signature indel (CSI). Streckarna indikerar närvaron av en aminosyra identisk med den på översta raden.

Huvudlinje-CSI är de där en bevarad infogning eller radering delas av flera stora phyla, men frånvarande från andra phyla.

Figur 2 visar ett exempel på 5aa CSI som finns i en bevarad region som vanligtvis förekommer i arten som tillhör phyla X, Y och Z, men det är frånvarande i andra phyla (A, B och C). Denna signatur indikerar ett specifikt förhållande mellan taxa X, Y och Z och även A, B och C. Baserat på närvaron eller frånvaron av en sådan indel, i utgrupperade arter (nämligen Archaea), kan det utläsas om indel är en insats eller en radering, och vilken av dessa två grupper A, B, C eller X, Y, Z är förfäder.

Huvudlinje-CSI har använts tidigare för att bestämma det fylogenetiska sambandet mellan ett antal bakteriella fyla. Den stora CSI på cirka 150-180 aminosyror inom ett bevarat område av Gyras B (mellan aminosyror 529-751) delas vanligen mellan olika Proteobacteria , Chlamydiales , Planctomycetes och Aquificales- arter. Denna CSI saknas i andra förfädernas bakteriefyla samt i Archaea . På liknande sätt finns ett stort CSI på cirka 100 aminosyror i RpoB- homologer (mellan aminosyror 919-1058) närvarande i olika arter som tillhör Proteobacteria , Bacteroidetes-Chlorobi , Chlamydiales , Planctomycetes och Aquificales . Denna CSI saknas i andra förfädernas bakteriefyla samt i Archaea . I båda fallen kan man dra slutsatsen att grupperna som saknar CSI är förfäder.

Evolutionära studier baserade på CSI

Figur 3: Ett sammanfogat proteinträd som visar det fylogenetiska förhållandet mellan gruppen Thermotogae. Antalet CSI som stöder förgreningsordningen anges.
Figur 4: Ett sammanfogat proteinträd som visar det fylogenetiska förhållandet mellan två phyla av Archaea. Antalet CSI som stöder förgreningsordningen anges.
Figur 5: Ett sammanfogat proteinträd som visar det fylogenetiska förhållandet mellan gruppen Pasteurellales. Antalet CSI som stöder förgreningsordningen anges.

En nyckelfråga i bakteriell fylogeni är att förstå hur olika bakteriearter är relaterade till varandra och deras förgreningsordning från en gemensam förfader. För närvarande är de flesta fylogenetiska träd baserade på 16S rRNA eller andra gener/proteiner. Dessa träd kan inte alltid lösa viktiga fylogenetiska frågor med hög grad av säkerhet. Men under de senaste åren har upptäckten och analyserna av konserverade indeler (CSI) i många universellt distribuerade proteiner hjälpt till i denna strävan. De genetiska händelserna som leder till dem antas ha inträffat vid viktiga evolutionära grenpunkter och deras artfördelningsmönster ger värdefull information om förgreningsordningen och inbördes samband mellan olika bakteriefyla.

Thermotogae

Nyligen karakteriserades det fylogenetiska förhållandet mellan gruppen Thermotogae baserat på CSI -metoden. Tidigare var inga biokemiska eller molekylära markörer kända som tydligt kunde skilja arten i detta fylum från alla andra bakterier. Mer än 60 CSI som var specifika för hela Thermotogae -filylen eller dess olika undergrupper upptäcktes. 18 CSI är unikt närvarande i olika Thermotogae -arter och tillhandahåller molekylära markörer för fylmen. Dessutom fanns det många CSI som var specifika för olika termotoga -undergrupper. 12 CSI var specifika för en clade bestående av olika Thermotoga -arter utom Tt. Lettingae. 14CSI var specifika för en clade bestående av Fervidobacterium och Thermosipho släkten och 18 CSI var specifika för släktet Thermosiphon.

Slutligen rapporterades 16 CSI som delades av antingen några eller alla Thermotogae -arter eller några arter från andra taxa som Archaea , Aquificae , Firmicutes , Proteobacteria , Deinococcus , Fusobacteria , Dictyoglomus , Chloroflexi och eukaryotes . Den delade närvaron av några av dessa CSI kan bero på lateral genöverföring (LGT) mellan dessa grupper. Antalet CSI som vanligtvis delas med andra taxa är dock mycket mindre än de som är specifika för Thermotogae och de uppvisar inte något specifikt mönster. Därför har de ingen signifikant effekt på skillnaden mellan Thermotogae.

Archaea

Mesofila Crenarkaeoter placerades nyligen i en ny fila i Archaea som kallas Thaumarchaeota . Det finns dock väldigt få molekylära markörer som kan skilja denna grupp av archaea från phylum Crenarchaeota. En detaljerad fylogenetisk studie med CSI -tillvägagångssätt genomfördes för att skilja dessa fyla i molekylära termer. 6 CSI hittades unikt i olika Thaumarchaeota, nämligen Cenarchaeum symbiosum , Nitrosopumilus maritimus och ett antal okulturella marina crenarkaeoter. Tre CSI hittades som vanligtvis delades mellan arter som tillhör Thaumarchaeota och Crenarchaeota. Dessutom hittades ett antal CSI som är specifika för olika sorter av Crenarchaeota-3 CSI för Sulfolobales , 5 CSI för Thermoproteales , slutligen 2 CSI vanliga för Sulfolobales och Desulfurococcales . De beskrivna signaturerna ger nya medel för att skilja Crenarchaeota och Thaumarchaeota, dessutom kan de användas som ett verktyg för klassificering och identifiering av besläktade arter.

Pasteurellales

Medlemmarna i ordningen Pasteurellales skiljer sig för närvarande huvudsakligen utifrån deras position i förgreningen av 16srRNA -trädet. Det finns för närvarande mycket få molekylära markörer som kan skilja medlemmar i denna ordning från andra bakterier. Ett CSI -tillvägagångssätt användes nyligen för att belysa de fylogenetiska förhållandena mellan arterna i denna ordning; mer än 40 CSI upptäcktes som unikt delades av alla eller de flesta arterna. Två stora klader bildas inom denna Pasteurellales: Clade I, som omfattar Aggregatibacter , Pasteurella , Actinobacillus succinogenes, Mannheimia succiniciproducens, Haemophilus influenzae och Haemophilus somnus, stöddes av 13 CSI. Clade II, omfattande Actinobacillus pleuropneumoniae, Actinobacillus minor, Haemophilus ducreyi , Mannheimia haemolytica och Haemophilus parasuis, stöddes av 9 CSI. Baserat på dessa resultat föreslogs att Pasteurellales skulle delas upp från sin nuvarande familj i två olika. Dessutom skulle de beskrivna signaturerna tillhandahålla nya sätt att identifiera oupptäckta Pasteurellales -arter.

Gammaproteobakterier

Klassen Gammaproteobacteria utgör en av de största bakteriegrupperna. Det skiljer sig för närvarande från andra bakterier enbart av rs -baserade fylogenetiska träd från 16 -talet. Inga molekylära egenskaper som är unika för klassen eller dess olika undergrupper är kända. En detaljerad CSI-baserad studie genomfördes för att bättre förstå fylogenin i denna klass. För det första skapades ett fylogenetiskt träd baserat på sammanfogade sekvenser av ett antal universellt fördelade proteiner. Förgrenings ordningen på de olika order av klassen Gammaproteobacteria (från det senaste till det tidigaste divergerande) var: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , pseudomonadales > Chromatiales , Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Dessutom upptäcktes 4 CSI som var unika för de flesta arter i klassen Gammaproteobacteria. En 2 aa -deletion i AICAR -transformylas delades unikt av alla gammaproteobakterier utom Francisella tularensis . En 4 aa-deletion i RNA-polymeras b-subenhet och en 1 aa-deletion i ribosomalt protein L16 hittades unikt i olika arter som tillhör ordern Enterobacteriales , Pasteurellales , Vibrionales , Aeromonadales och Alteromonadales , men hittades inte i andra gammaproteobakterier. Slutligen var en 2 aa-deletion i leucyl-tRNA-syntetas vanligt förekommande i ovanstående ordningar i klassen Gammaproteobacteria och hos vissa medlemmar av ordningen Oceanospirillales . En annan CSI -baserad studie har också identifierat 4 CSI som är exklusiva för ordern Xanthomonadales. Sammantaget visar dessa två fakta att Xanthomonadales är en monofyletisk grupp som är förfäder till andra Gammaproteobakterier, vilket vidare visar att Xanthomonadales är en oberoende underavdelning och utgör en av de djupaste grenarna inom Gammaproteobacteria-kladen.

Svampar

Det exakta fylogenetiska förhållandet mellan växter , djur och svampar är inte väl förstått. En liten CSI-baserad studie genomfördes för att belysa detta förhållande. Fyra CSI användes för att placera djur och svampar tillsammans som en monofyletisk grupp och utesluta växter. Dessa CSI hittades i två väsentliga cellulära proteiner, töjningsfaktor l och enolas . Traditionellt har dock detta specifika förhållande mellan svampar och djur inte stötts.

Referenser