Astrofysikdatasystem - Astrophysics Data System

Astrofysikdatasystem
ADS logo.png
ADS-logotypen
Producent Harvard – Smithsonian Center for Astrophysics for the National Aeronautics and Space Administration (USA)
Historia 1992 att presentera
Tillgång
Kosta Fri
Rapportering
Discipliner Astronomi och fysik
Spela in djup Index & abstrakt & fulltext
Geospatial täckning Över hela världen
Länkar
Hemsida http://www.adsabs.harvard.edu/

Det Astrophysics Data System ( ADS ) är en online-databas med över åtta miljoner astronomi och fysik papper från både över inbördes och icke-vetenskapligt granskade källor. Abstrakt finns gratis online för nästan alla artiklar, och fullständiga skannade artiklar finns i Graphics Interchange Format (GIF) och Portable Document Format (PDF) för äldre artiklar. Den utvecklades av National Aeronautics and Space Administration (NASA) och hanteras av Harvard – Smithsonian Center for Astrophysics .

ADS är ett kraftfullt forskningsverktyg och har haft en betydande inverkan på astronomisk forskningseffektivitet sedan den lanserades 1992. Litteratursökningar som tidigare skulle ha tagit dagar eller veckor kan nu utföras på några sekunder via ADS-sökmotorn, vilket är specialbyggd för astronomiska behov. Studier har visat att nyttan för astronomin av ADS motsvarar flera hundra miljoner US dollar per år, och systemet beräknas ha tredubblat läsekretsen för astronomiska tidskrifter.

Användning av ADS är nästan universell bland astronomer världen över, och därför kan ADS-användningsstatistik användas för att analysera globala trender inom astronomisk forskning. Dessa studier har visat att mängden forskning som en astronom bedriver är relaterad till bruttonationalprodukten per capita (BNP) i det land där han / hon är baserad och att antalet astronomer i ett land är proportionellt mot BNP i det landet, så den totala mängden forskning som görs i ett land är proportionell mot kvadratet av dess BNP dividerat med dess befolkning.

Historia

Under många år var ett växande problem i astronomisk forskning (som i andra akademiska discipliner) att antalet artiklar publicerade i de stora astronomiska tidskrifterna ökade stadigt, vilket innebär att astronomer kunde läsa mindre och mindre av de senaste forskningsresultaten. Under 1980-talet såg astronomer att de framväxande teknologierna som låg till grund för Internet så småningom kunde användas för att bygga ett elektroniskt indexeringssystem av astronomiska forskningspapper som skulle göra det möjligt för astronomer att hålla sig à jour med ett mycket större forskningsområde.

Det första förslaget om en databas över journalabstraktabstrakt gjordes vid en konferens om astronomi från stora databaser som hölls i Garching bei München 1987. Den första utvecklingen av ett elektroniskt system för åtkomst till astrofysiska abstrakter ägde rum under de följande två åren; 1991 diskuterades hur man integrerar ADS med SIMBAD- databasen, som innehåller alla tillgängliga katalogbeteckningar för objekt utanför solsystemet , för att skapa ett system där astronomer kan söka efter alla papper skrivna om ett visst objekt.

En ursprunglig version av ADS, med en databas bestående av 40 papper, skapades som ett bevis på koncept 1988 och ADS-databasen kopplades framgångsrikt till SIMBAD-databasen sommaren 1993. Skaparna trodde att detta var den första användningen av Internet för att möjliggöra samtidig frågeställning av transatlantiska vetenskapliga databaser. Fram till 1994 var tjänsten tillgänglig via egen nätverksprogramvara, men den överfördes till det framväxande World Wide Web tidigt samma år. Antalet användare av tjänsten fyrdubblades de fem veckorna efter introduktionen av ADS webbaserade tjänst.

Först skannades de tidskriftsartiklar som var tillgängliga via ADS bitmaps som skapades från papperstidningarna, men från och med 1995 började Astrophysical Journal att publicera en on-line-upplaga, snart följt av de andra huvudtidskrifterna som Astronomy and Astrophysics and the Monthly Meddelanden från Royal Astronomical Society . ADS tillhandahöll länkar till dessa elektroniska utgåvor från första uppträdande. Sedan omkring 1995 har antalet ADS-användare fördubblats ungefär vartannat år. ADS har nu avtal med nästan alla astronomiska tidskrifter som tillhandahåller abstrakt. Skannade artiklar från början av 1800-talet är tillgängliga via tjänsten, som nu innehåller över åtta miljoner dokument. Tjänsten distribueras över hela världen, med tolv spegelsidor i tolv länder på fem kontinenter, med databasen synkroniserad med veckovisa uppdateringar med rsync , ett speglingsverktyg som endast möjliggör uppdateringar av de delar av databasen som har ändrats. Alla uppdateringar utlöses centralt, men de initierar skript på spegelsidorna som "hämtar" uppdaterade data från de viktigaste ADS-servrarna.

Data i systemet

1284 papper om M101 är tillgängliga via ADS, från så länge sedan 1850.

Papper indexeras i databasen av deras bibliografiska dokument, som innehåller information om tidskriften de publicerades i och olika associerade metadata , såsom författarlistor, referenser och citat . Ursprungligen lagrades dessa data i ASCII- format, men så småningom uppmuntrade begränsningarna av detta databashållarna att migrera alla poster till ett XML- format (Extensible Markup Language) år 2000. Bibliografiska poster lagras nu som ett XML-element med underelement för de olika metadata.

Sedan tillkomsten av onlineutgåvor av tidskrifter laddas abstrakt in i ADS före eller före publiceringsdatum för artiklar, med den fullständiga journaltexten tillgänglig för prenumeranter. Äldre artiklar har skannats och ett abstrakt skapas med programvara för optisk teckenigenkänning . Skannade artiklar från före 1995 är vanligtvis tillgängliga gratis, efter överenskommelse med tidningsförläggarna.

Skannade artiklar lagras i TIFF- format, i både medelhög och hög upplösning . TIFF-filerna konverteras på begäran till GIF-filer för visning på skärmen och PDF- eller PostScript- filer för utskrift. De genererade filerna cachas sedan för att eliminera onödigt frekventa regenereringar för populära artiklar. Från och med 2000 innehöll ADS 250 GB skanningar, som bestod av 1 128 955 artikelsidor bestående av 138 789 artiklar. År 2005 hade detta vuxit till 650 GB och förväntas växa ytterligare till cirka 900 GB 2007. Ingen ytterligare information har publicerats.

Databasen innehöll ursprungligen endast astronomiska referenser, men har nu vuxit till att omfatta tre databaser, som omfattar astronomi (inklusive planetvetenskap och solfysik), fysik (inklusive instrument och geovetenskap), samt förtryck av vetenskapliga artiklar från arXiv . Astronomidatabasen är den överlägset mest avancerade och dess användning står för cirka 85% av den totala ADS-användningen. Artiklar tilldelas de olika databaserna beroende på ämnet snarare än tidskriften de publiceras i, så att artiklar från vilken tidskrift som helst kan visas i alla tre ämnesdatabaserna. Separationen av databaserna gör det möjligt att skräddarsy sökning i varje disciplin, så att ord automatiskt kan ges olika viktfunktioner i olika databassökningar, beroende på hur vanliga de är i det relevanta fältet.

Data i förtryckarkivet uppdateras dagligen från arXiv , huvudförvaret för förtryck av fysik och astronomi. Tillkomsten av preprint-servrar har, precis som ADS, haft en betydande inverkan på astronomisk forskning, eftersom papper ofta görs tillgängliga från preprint-servrar veckor eller månader innan de publiceras i tidskrifterna. Införlivandet av förtryck från arXiv i ADS innebär att sökmotorn kan returnera den senaste tillgängliga forskningen, med förbehållet att förtryck kanske inte har granskats eller korrekturlästs till den standard som krävs för publicering i huvudtidskrifterna. ADS: s databas länkar förtryck med senare publicerade artiklar där det är möjligt, så att citations- och referenssökningar kommer att returnera länkar till tidskriftsartikeln där förtrycket citerades.

Programvara och hårdvara

Programvaran körs på ett system som skrevs speciellt för det, vilket möjliggör omfattande anpassning för astronomiska behov som inte skulle ha varit möjliga med databasprogramvara för allmänt bruk . Skripten är utformade för att vara så plattformsoberoende som möjligt, med tanke på behovet av att underlätta spegling på olika system runt om i världen, även om den växande användningen av Linux som operativsystem som valts inom astronomi har lett till ökad optimering av skript för installation på den plattformen.

Den huvudsakliga ADS-servern finns på Harvard-Smithsonian Center for Astrophysics i Cambridge, Massachusetts , och är en dubbel 64-bitars X86 Intel- server med två fyrkärniga 3.0 GHz- processorer och 32 GB RAM , som kör CentOS 5.4 Linux- distribution. Speglar finns i Brasilien, Kina, Chile, Frankrike, Tyskland, Indien, Indonesien, Japan, Ryssland, Sydkorea, Storbritannien och Ukraina.

Indexering

ADS tar för närvarande sammanfattningar eller innehållsförteckningar från nästan tvåhundra källor. Tjänsten kan ta emot data som hänvisar till samma artikel från flera källor och skapar en bibliografisk referens baserad på de mest exakta uppgifterna från varje källa. Den vanliga användningen av TeX och LaTeX av nästan alla vetenskapliga tidskrifter underlättar i hög grad införlivandet av bibliografiska data i systemet i ett standardiserat format, och det är också enkelt att importera HTML- kodade webbaserade artiklar. ADS använder Perl- skript för import, bearbetning och standardisering av bibliografiska data.

Den till synes vardagliga uppgiften att konvertera författarnamn till en standard efternamn , Initial är format faktiskt en av de svårare att automatisera, på grund av det stora utbudet av namnkonventioner runt om i världen och möjligheten att ett givet namn såsom Davis skulle kunna vara ett första namn , mellannamn eller efternamn. Den korrekta konverteringen av namn kräver en detaljerad kunskap om namnen på författare som är verksamma inom astronomi, och ADS har en omfattande databas med författarnamn, som också används för att söka i databasen (se nedan).

För elektroniska artiklar extraheras enkelt en lista med referenser som ges i slutet av artikeln. För skannade artiklar är referensextraktion beroende av OCR. Referensdatabasen kan sedan "inverteras" för att lista citat för varje papper i databasen. Citatlistor har tidigare använts för att identifiera populära artiklar som saknas i databasen. oftast var dessa från före 1975 och har nu lagts till i systemet.

Rapportering

Databasen innehåller nu över åtta miljoner artiklar. När det gäller de största tidskrifterna inom astronomi ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific and the Monthly Notices of the Royal Astronomical Society ) är täckningen komplett, med alla nummer indexerade från nummer 1 till nutid. Dessa tidskrifter står för ungefär två tredjedelar av artiklarna i databasen, medan resten består av artiklar publicerade i över 100 andra tidskrifter från hela världen samt i konferensförfaranden.

Även om databasen innehåller det fullständiga innehållet i alla större tidskrifter och många mindre, är dess täckning av referenser och citat mycket mindre komplett. Hänvisningar till och citeringar av artiklar i större tidskrifter är ganska fullständiga, men referenser som "privat kommunikation", "i press" eller "under förberedelse" kan inte matchas, och författarfel i referenslistor medför också potentiella fel. Astronomiska artiklar kan citera och citeras av artiklar i tidskrifter som faller utanför ADS: s tillämpningsområde, såsom kemi- , matematik- eller biologitidskrifter .

Sökmotor

Ett exempel på en komplex sökning som kombinerar objekt-, titel- och abstraktfrågor med ett datumfilter

Sedan starten har ADS utvecklat en mycket komplex sökmotor för att fråga de abstrakta och objektdatabaserna. Sökmotorn är skräddarsydd för att söka i astronomiska abstrakt, och motorn och dess användargränssnitt antar att användaren är väl insatt i astronomi och kan tolka sökresultat som är utformade för att returnera mer än bara de mest relevanta artiklarna. Databasen kan förfrågas för författarnamn, astronomiska objektnamn , titelord och ord i den abstrakta texten, och resultaten kan filtreras enligt ett antal kriterier. Det fungerar genom att först samla synonymer och förenkla söktermer som beskrivs ovan, och sedan skapa en "inverterad fil", som är en lista över alla dokument som matchar varje sökterm. Den användarvalda logiken och filtren tillämpas sedan på den här inverterade listan för att skapa de slutliga sökresultaten.

Frågor om författarnamn

Systemet indexerar författarnamn efter efternamn och initialer och redogör för möjliga variationer i stavning av namn med hjälp av en lista med variationer. Detta är vanligt när det gäller namn inklusive accenter som paraplyer och translitterationer från arabiska eller kyrilliska skrifter . Ett exempel på en post i författarens synonymlista är:

AFANASJEV, V
AFANAS'EV, V
AFANAS'IEV, V
AFANASEV, V
AFANASYEV, V
AFANS'IEV, V
AFANSEV, V

Objektnamnssökningar

Förmågan att söka efter papper om specifika astronomiska föremål är ett av ADS mest kraftfulla verktyg. Systemet använder data från SIMBAD , NASA / IPAC Extragalactic Database , International Astronomical Union Circulars och Lunar and Planetary Institute för att identifiera papper som hänvisar till ett visst objekt, och kan också söka efter objektposition och lista papper som rör objekt i en 10  bågminutradie för en given höger uppstigning och deklination . Dessa databaser kombinerar de många katalogbeteckningar som ett objekt kan ha, så att en sökning efter Pleiaderna också hittar papper som listar det berömda öppna klustret i Oxen under någon av dess andra katalogbeteckningar eller populära namn, såsom M45, de sju systrarna eller Melotte 22.

Titel och abstrakta sökningar

Sökmotorn filtrerar först sökord på flera sätt. Ett M följt av ett mellanslag eller bindestreck tar bort mellanslaget eller bindestrecket, så att sökning efter Messier-katalogobjekt förenklas och en användarinmatning av M45, M 45 eller M-45 resulterar i att samma fråga utförs; På samma sätt är NGC- beteckningar och vanliga söktermer som Shoemaker Levy och T Tauri berövade utrymmen. Oviktiga ord såsom AT, OR och TO strippas ut, även om i vissa fall bokstavssärskiljnings bibehålls, så att medan en nd ignoreras, A nd omvandlas till " Andromedae ", och H er omvandlas till " Herculis ", men hon ignoreras.

Ersättning av synonym

När söktermerna har förbehandlats frågas databasen med den reviderade söktermen samt synonymer för den. Förutom enkel ersättning av synonymer som att söka efter både plural- och singularformer , söker ADS också efter ett stort antal specifikt astronomiska synonymer. Till exempel har spektrograf och spektroskop i princip samma betydelse, och i ett astronomiskt sammanhang är också metallicitet och överflöd synonymt. ADSs synonymlista skapades manuellt genom att gruppera listan med ord i databasen enligt liknande betydelser.

Förutom engelskspråkiga synonymer söker ADS också efter engelska översättningar av utländska sökord och vice versa, så att en sökning efter det franska ordet soleil hämtar referenser till Sun , och papper på andra språk än engelska kan returneras med engelska söktermer.

Ersättning av synonymer kan inaktiveras om så krävs, så att en sällsynt term som är en synonym för en mycket vanligare term (som " datelinje " snarare än " datum ") kan sökas specifikt.

Urvalslogik

Sökmotorn tillåter urvalslogik både inom fält och mellan fält. Söktermer i varje fält kan kombineras med OR, AND, enkel logik eller boolsk logik , och användaren kan ange vilka fält som måste matchas i sökresultaten. Detta gör det möjligt att bygga komplexa sökningar; till exempel kan användaren söka efter papper som rör NGC 6543 ELLER NGC 7009 , med papperstitlarna som innehåller (radie ELLER hastighet) OCH INTE (överflöd ELLER temperatur).

Resultatfiltrering

Sökresultat kan filtreras enligt ett antal kriterier, inklusive att specificera ett antal år som "1945 till 1975", "2000 till idag" eller "före 1900", och vilken typ av tidskrift artikeln visas i - icke -Peer-reviewed artiklar som konferensförfaranden kan uteslutas eller sökas specifikt, eller specifika tidskrifter kan inkluderas i eller uteslutas från sökningen.

Sökresultat

Sökresultatsida från ADS - A, F, G, C, R etc. är länkar till tillhörande data för varje abstrakt som fulltextartikel, citat, även lästa artiklar och så vidare.

Även om det var tänkt som ett sätt att få tillgång till abstrakter och papper, tillhandahåller ADS en betydande mängd kompletterande information tillsammans med sökresultat. För varje återfört abstrakt tillhandahålls länkar till andra papper i databasen som det hänvisas till, och som citerar papperet, och en länk tillhandahålls till en förtryck, där en finns. Systemet genererar också en länk till "även-lästa" artiklar - det vill säga de som har lästs mest av dem som läser artikeln. På detta sätt kan en ADS-användare avgöra vilka papper som är mest intressanta för astronomer som är intresserade av ämnet för ett visst papper.

Dessutom returneras länkar till SIMBAD och / eller NASA Extragalactic Database-objektnamndatabaser, via vilka en användare snabbt kan ta reda på grundläggande observationsdata om objekten som analyseras i ett papper och hitta ytterligare papper om dessa objekt.

Påverkan på astronomi

ADS används nästan universellt som ett forskningsverktyg bland astronomer, och det finns flera studier som kvantitativt har uppskattat hur mycket effektivare ADS har gjort astronomi; en uppskattade att ADS ökade effektiviteten i astronomisk forskning med 333 heltidsekvivalenta forskningsår per år, och en annan fann att dess effekt 2002 motsvarade 736 heltidsforskare, eller all astronomisk forskning som gjorts i Frankrike. ADS har gjort det möjligt att genomföra litteratursökningar som tidigare skulle ta dagar eller veckor att genomföra på några sekunder, och det uppskattas att ADS har ökat läsekretsen och användningen av den astronomiska litteraturen med en faktor på cirka tre sedan starten.

I monetära termer representerar denna effektivitetsökning en betydande mängd. Det finns cirka 12 000 aktiva astronomiska forskare över hela världen, så ADS motsvarar cirka 5% av den arbetande befolkningen av astronomer. Den globala astronomiska forskningsbudgeten uppskattas till mellan 4000 och 5 000 miljoner US dollar, så ADS: s värde för astronomi skulle vara cirka 200-250 miljoner USD årligen. Dess driftsbudget är en liten del av detta belopp.

ADS: s stora betydelse för astronomer har erkänts av Förenta nationerna , vars generalförsamling har berömt ADS för dess arbete och framgång, och särskilt noterat dess betydelse för astronomer i utvecklingsländerna, i rapporter från FN: s kommitté för fredliga Användning av yttre rymden . En rapport från en besökande kommitté från 2002 till Center for Astrophysics sade emellertid att tjänsten hade "revolutionerat användningen av den astronomiska litteraturen" och var "förmodligen det mest värdefulla bidraget till astronomiforskning som CfA har gjort under sin livstid ".

Sociologiska studier med ADS

Eftersom det används nästan universellt av astronomer kan ADS avslöja mycket om hur astronomisk forskning fördelas över hela världen. De flesta användare använder systemet från högskolor, vars IP-adress lätt kan användas för att bestämma användarens geografiska läge. Studier visar att de största användarna per capita av ADS är astronomer baserade på Frankrike och Nederländerna , och medan mer utvecklade länder (mätt med BNP per capita ) använder systemet mer än mindre utvecklade länder; förhållandet mellan BNP per capita och ADS-användning är inte linjärt. Utbudet av ADS-användning per capita överstiger långt BNP-intervallet per capita, och grundforskning i ett land, mätt med ADS-användning, har visat sig vara proportionell mot kvadratet av landets BNP dividerat med dess befolkning.

ADS-användningsstatistik antyder också att astronomer i mer utvecklade länder tenderar att vara mer produktiva än de i mindre utvecklade länder. Mängden grundforskning som utförs är proportionell mot antalet astronomer i ett land multiplicerat med BNP per capita. Statistik antyder också att astronomer i europeiska kulturer bedriver ungefär tre gånger så mycket forskning som i asiatiska kulturer , vilket kanske tyder på kulturella skillnader i den betydelse som läggs vid astronomisk forskning.

ADS har också använts för att visa att andelen astronomidokument med en författare har minskat avsevärt sedan 1975 och att astronomiska tidningar med mer än 50 författare har blivit vanligare sedan 1990.

Se även

Referenser

externa länkar