Genontologi - Gene Ontology

Genontologin
Database.png
Innehåll
Beskrivning Resurs med kontrollerat ordförråd för att beskriva funktionerna hos gener och genprodukter
Tillgång
Hemsida genontologi .org

Den Gene ontologi ( GO ) är ett stort bioinformatik initiativ för att förena representationen av genen och gen produktattribut i alla arter . Mer specifikt syftar projektet till att: 1) upprätthålla och utveckla sitt kontrollerade ordförråd med gen- och genproduktattribut; 2) kommentera gener och genprodukter, och assimilera och sprida annotationsdata; och 3) tillhandahålla verktyg för enkel åtkomst till alla aspekter av data som tillhandahålls av projektet och för att möjliggöra funktionell tolkning av experimentella data med hjälp av GO, till exempel via berikningsanalys. GO är en del av en större klassificering, Open Biomedical Ontologies , som är en av de initiala kandidatmedlemmarna i OBO Foundry .

Medan gennomenklatur fokuserar på gen- och genprodukter, fokuserar Gene Ontology på funktionen hos generna och genprodukterna. GO utökar också ansträngningen genom att använda markeringsspråk för att göra data (inte bara om generna och deras produkter utan också av kurerade attribut) maskinläsbara och för att göra det på ett sätt som är enhetligt för alla arter (medan gennomenklaturkonventioner varierar beroende på biologisk taxon ).

Villkor och ontologi

Ur en praktisk syn är en ontologi en representation av något vi vet om. "Ontologier" består av representationer av saker som är detekterbara eller direkt observerbara och relationerna mellan dessa saker. Det finns ingen universell standardterminologi inom biologi och relaterade domäner, och termanvändningar kan vara specifika för en art, forskningsområde eller till och med en viss forskargrupp. Detta försvårar kommunikation och delning av data. Gene Ontology -projektet ger en ontologi med definierade termer som representerar genproduktens egenskaper. Ontologin täcker tre områden:

Varje GO -term inom ontologin har ett termnamn, som kan vara ett ord eller en ordsträng; en unik alfanumerisk identifierare; en definition med citerade källor; och en ontologi som indikerar den domän som den tillhör. Termer kan också ha synonymer, som klassas som exakt likvärdiga med termen namn, bredare, smalare eller relaterad; referenser till likvärdiga begrepp i andra databaser; och kommentarer om termens betydelse eller användning. GO -ontologin är uppbyggd som en riktad acyklisk graf , och varje term har definierade relationer till en eller flera andra termer i samma domän och ibland till andra domäner. GO-ordförrådet är utformat för att vara artneutralt och innehåller termer som gäller för prokaryoter och eukaryoter , enstaka och flercelliga organismer .

GO är inte statisk, och tillägg, korrigeringar och ändringar föreslås av och efterfrågas av medlemmar i forsknings- och annotationssamhällen, såväl som av dem som är direkt involverade i GO -projektet. Till exempel kan en annotator begära en specifik term för att representera en metabolisk väg, eller så kan en del av ontologin revideras med hjälp av gemenskapsexperter (t.ex.). Föreslagna ändringar granskas av ontologiredaktörerna och implementeras där så är lämpligt.

GO -ontologi- och annotationsfilerna är fritt tillgängliga från GO -webbplatsen i ett antal format, eller kan nås online med GO -webbläsaren AmiGO . Gene Ontology -projektet tillhandahåller också nedladdningsbara mappningar av dess termer till andra klassificeringssystem.

Exempel term

id: GO: 0000016
namn: laktasaktivitet
ontologi: molekylär_funktion
def: "Katalys av reaktionen: laktos + H2O = D-glukos + D-galaktos." [EG: 3.2.1.108]
synonym: "laktas-florizinhydrolasaktivitet" BROAD [EC: 3.2.1.108]
synonym: "laktosgalaktohydrolasaktivitet" EXAKT [EG: 3.2.1.108]
xref: EG: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! hydrolasaktivitet, hydrolysering av O-glykosylföreningar

Datakälla:

Anteckning

Genomkommentering omfattar praxis att fånga data om en genprodukt, och GO -anteckningar använder termer från GO för att göra det. Anteckningar från GO -kuratorer integreras och sprids på GO: s webbplats, där de kan laddas ner direkt eller ses online med AmiGO. Förutom genproduktidentifieraren och den relevanta GO -termen har GO -anteckningar åtminstone följande data: Referensen som används för att göra kommentaren (t.ex. en tidningsartikel); En beviskod som anger vilken typ av bevis som anteckningen bygger på. Datumet och skaparen av annotationen

Stödinformation, beroende på GO -term och bevis som används och kompletterande information, till exempel de förhållanden som funktionen observeras under, kan också ingå i en GO -kommentar.

Beviskoden kommer från ett kontrollerat ordförråd med koder, Evidence Code Ontology, som täcker både manuella och automatiserade annoteringsmetoder. Till exempel betyder Spårbar författarförklaring (TAS) att en kurator har läst en publicerad vetenskaplig uppsats och metadata för den kommentaren har en hänvisning till den uppsatsen. Beräknat från sekvenslikhet (ISS) innebär att en mänsklig kurator har granskat resultatet från en sekvenslikhetssökning och verifierat att det är biologiskt meningsfullt. Annoteringar från automatiserade processer (till exempel ommappning av annoteringar som skapats med hjälp av ett annat annotationsordförråd) ges koden Sluts från Electronic Annotation (IEA). Under 2010 drogs över 98% av alla GO -anteckningar beräknat, inte av kuratorer, men från och med den 2 juli 2019 var endast cirka 30% av alla GO -annoteringar beräknade beräknat. Eftersom dessa kommentarer inte kontrolleras av en människa anser GO -konsortiet att de är marginellt mindre tillförlitliga och de är vanligtvis till högre nivå, mindre detaljerade termer. Fullständiga annotationsdatauppsättningar kan laddas ner från GO -webbplatsen. För att stödja utvecklingen av annotering erbjuder GO -konsortiet workshops och mentorer för nya grupper av kuratorer och utvecklare.

Många maskininlärningsalgoritmer har utformats och implementerats för att förutsäga Gene Ontology -kommentarer.

Exempel på kommentarer

Genprodukt: Actin , alfa hjärtmuskel 1, UniProtKB: P68032
GO -term: hjärtkontraktion; GO: 0060047 (biologisk process)
Bevisskod: Avgörande från mutant fenotyp (IMP)
Referens: PMID  17611253
Tilldelad av: UniProtKB, 6 juni 2008

Datakälla:

Verktyg

Det finns ett stort antal verktyg tillgängliga både online och för nedladdning som använder data från GO -projektet. De allra flesta av dessa kommer från tredje part; GO-konsortiet utvecklar och stöder två verktyg, AmiGO och OBO-Edit .

AmiGO är en webbaserad applikation som tillåter användare att söka, bläddra och visualisera ontologier och genproduktkommentarer. Den har också ett BLAST -verktyg, verktyg som möjliggör analys av större datamängder och ett gränssnitt för att direkt söka i GO -databasen.

AmiGO kan användas online på GO: s webbplats för att få åtkomst till data från GO Consortium, eller kan laddas ner och installeras för lokal användning på vilken databas som helst som använder GO -databasschemat (t.ex.). Det är gratis programvara med öppen källkod och är tillgänglig som en del av Go-Dev-programvarudistributionen.

OBO-Edit är en öppen källkod, plattformsoberoende ontologiredaktör som utvecklats och underhålls av Gene Ontology Consortium. Den är implementerad i Java och använder en grafinriktad metod för att visa och redigera ontologier. OBO-Edit innehåller ett omfattande sök- och filtergränssnitt, med möjlighet att göra delmängder av termer för att göra dem visuellt distinkta; användargränssnittet kan också anpassas efter användarens preferenser. OBO-Edit har också ett resonemang som kan utgå från länkar som inte uttryckligen har angetts, baserat på befintliga relationer och deras egenskaper. Även om det utvecklades för biomedicinsk ontologi, kan OBO-Edit användas för att visa, söka och redigera vilken ontologi som helst. Det är fritt tillgängligt att ladda ner.

Konsortium

Gene Ontology Consortium är en uppsättning biologiska databaser och forskargrupper som aktivt är involverade i genontologiprojektet. Detta inkluderar ett antal modellorganismdatabaser och multi-art proteindatabaser , programvaruutvecklingsgrupper och en dedikerad redaktion.

Historia

Genontologin konstruerades ursprungligen 1998 av ett konsortium av forskare som studerade genomerna för tre modellorganismer : Drosophila melanogaster (fruktfluga), Mus musculus (mus) och Saccharomyces cerevisiae (öl- eller bagerjäst). Många andra modellorganismdatabaser har anslutit sig till Gene Ontology Consortium, vilket inte bara bidrar med anteckningsdata, utan också bidrar till utvecklingen av ontologier och verktyg för att se och tillämpa data. Många stora växt-, djur- och mikroorganismdatabaser bidrar till detta projekt. Från och med juli 2019 innehåller GO 44 445 villkor; det finns 6 408 283 kommentarer till 4 467 olika biologiska organismer. Det finns en betydande mängd litteratur om utveckling och användning av GO, och det har blivit ett standardverktyg i bioinformatikarsenalen . Deras mål har tre aspekter: att bygga genontologi, tilldela ontologi till gen-/genprodukter och utveckla programvara och databaser för de två första objekten.

Flera analyser av Gene Ontology med formella, domänoberoende egenskaper hos klasser (metaproperties) börjar också dyka upp. Till exempel ser en ontologisk analys av biologiska ontologier.

Se även

Referenser

externa länkar