Datorassisterad översättning - Computer-assisted translation

Computer-aided translation ( CAT ), även kallad maskinassisterad översättning ( MAT ) eller maskinassisterad mänsklig översättning ( MAHT ), är användningen av programvara för att hjälpa en mänsklig översättare i översättningsprocessen . Översättningen skapas av en människa, och vissa aspekter av processen underlättas av programvara; detta står i kontrast till maskinöversättning (MT), där översättningen skapas av en dator, eventuellt med viss mänsklig intervention (t.ex. förredigering och efterredigering).

Med CAT -verktyg menas vanligtvis program som specifikt underlättar själva översättningsprocessen. De flesta CAT -verktyg har (a) möjligheten att översätta en mängd olika källfilformat i en enda redigeringsmiljö utan att behöva använda filformatets associerade programvara för de flesta eller hela översättningsprocessen, (b) översättningsminne och (c) integration av olika verktyg eller processer som ökar produktiviteten och konsekvensen i översättningen.

Utbud av verktyg

Datorassisterad översättning är en bred och oprecis term som täcker en rad verktyg. Dessa kan inkludera:

  • Översättningsminnesverktyg (TM -verktyg), som består av en databas med textsegment på ett källspråk och deras översättningar på ett eller flera målspråk.
  • Stavningskontroll , antingen inbyggd i ordbehandlingsprogram , eller tillgänglig som tilläggsprogram .
  • Grammatikcheckar , antingen inbyggda i ordbehandlingsprogram, eller tillgängliga som tilläggsprogram.
  • Terminologichefer , som tillåter översättare att hantera sin egen terminologibank i elektronisk form. Detta kan sträcka sig från en enkel tabell som skapats i översättarens ordbehandlingsprogram eller kalkylblad, en databas som skapats i ett program som FileMaker Pro eller, för mer robusta (och dyrare) lösningar, specialiserade programpaket som SDL MultiTerm , LogiTerm, Termex , TermWeb, etc.
  • Elektroniska ordböcker, antingen enspråkiga eller tvåspråkiga
  • Terminologidatabaser, antingen på värddatorn eller tillgängliga via Internet, till exempel TERMIUM Plus eller Grand dictionnaire terminologique från Office québécois de la langue française
  • Fulltext-sökverktyg (eller indexerare), som tillåter användaren att söka efter redan översatta texter eller referensdokument av olika slag. Några sådana indexerare är ISYS Search Software , dtSearch Desktop och Naturel
  • Concordancers , som är program som hämtar förekomster av ett ord eller ett uttryck och deras respektive sammanhang i en enspråkig, tvåspråkig eller flerspråkig korpus, till exempel en bitxt eller ett översättningsminne
  • Bitext- justerare: verktyg som justerar en källtext och dess översättning som sedan kan analyseras med hjälp av ett fulltextsökverktyg eller en concordancer
  • Projektledningsprogramvara som gör att lingvister kan strukturera komplexa översättningsprojekt i en form av uppgiftskedja (kallas ofta "arbetsflöde"), tilldela de olika uppgifterna till olika personer och spåra framstegen för var och en av dessa uppgifter

Begrepp

Programvara för översättningsminne

Översättning minne program lagra tidigare översatt källtexter och deras motsvarande mål texter i en databas och hämta relaterade segment under översättningen av nya texter.

Sådana program delar upp källtexten i hanterbara enheter som kallas "segment". En källtexttext eller meningsliknande enhet (rubriker, titlar eller element i en lista) kan betraktas som ett segment. Texter kan också delas in i större enheter som stycken eller små, till exempel klausuler. När översättaren arbetar genom ett dokument, visar programvaran varje källsegment i tur och ordning och tillhandahåller en tidigare översättning för återanvändning om den hittar ett matchande källsegment i sin databas. Om det inte gör det tillåter programmet översättaren att ange en översättning för det nya segmentet. Efter att översättningen för ett segment är klar lagrar programmet den nya översättningen och går vidare till nästa segment. I det dominerande paradigmet är översättningsminnet i princip en enkel databas med fält som innehåller källspråksegmentet, segmentets översättning och annan information, till exempel segmentskapningsdatum, senaste åtkomst, översättarnamn och så vidare. En annan metod för översättningsminne innebär inte att en databas skapas, istället förlitar sig på anpassade referensdokument.

Vissa program för översättningsminne fungerar som fristående miljöer, medan andra fungerar som tillägg eller makro för kommersiellt tillgängliga ordbehandlingsprogram eller andra affärsprogram. Med tilläggsprogram kan källdokument från andra format, till exempel skrivbordsfiler, kalkylblad eller HTML- kod, hanteras med TM-programmet.

Språk sökmotor programvara

Ny för översättningsindustrin , Language search-engine-programvara är vanligtvis ett internetbaserat system som fungerar på samma sätt som sökmotorer på Internet. I stället för att söka på Internet söker en språksökmotor dock i ett stort arkiv med översättningsminnen för att hitta tidigare översatta meningsfragment, fraser, hela meningar, till och med fullständiga stycken som matchar källdokumentsegment.

Språksökmotorer är utformade för att utnyttja modern sökteknik för att utföra sökningar baserade på källorden i sitt sammanhang för att säkerställa att sökresultaten matchar källsegmentens betydelse. Precis som traditionella TM -verktyg vilar värdet på en språklig sökmotor starkt på det Translation Memory -arkiv som det söker mot.

Terminologihanteringsprogram

Terminologihanteringsprogramvara tillhandahåller översättaren ett sätt att automatiskt söka efter en given terminologidatabas efter termer som visas i ett dokument, antingen genom att automatiskt visa termer i översättningsminnesprogramvarans gränssnittsfönster eller genom att använda snabbtangenter för att visa posten i terminologidatabasen. Vissa program har andra snabbtangentkombinationer som gör att översättaren kan lägga till nya terminologipar till terminologidatabasen i farten under översättning. Några av de mer avancerade systemen gör det möjligt för översättare att kontrollera, antingen interaktivt eller i batchläge , om den korrekta käll-/måltermkombinationen har använts inom och över översättningsminnesegmenten i ett visst projekt. Oberoende terminologihanteringssystem finns också som kan ge arbetsflödesfunktionalitet, visuell taxonomi, fungera som en typ av termkontroll (liknande stavningskontroll, termer som inte har använts korrekt flaggas) och kan stödja andra typer av flerspråkiga termfasettklassificeringar som t.ex. bilder, videor eller ljud.

Justeringsprogram

Justeringsprogram tar färdiga översättningar, delar upp både käll- och måltexter i segment och försöker bestämma vilka segment som hör ihop för att bygga ett översättningsminne eller annan referensresurs med innehållet. Många justeringsprogram tillåter översättare att manuellt anpassa felaktiga segment. Den resulterande bitxt -justeringen (även känd som parallelltext ) kan sedan importeras till ett program för översättningsminne för framtida översättningar eller användas som referensdokument.

Interaktiv maskinöversättning

Interaktiv maskinöversättning är ett paradigm där det automatiska systemet försöker förutsäga översättningen den mänskliga översättaren kommer att producera genom att föreslå översättningshypoteser. Dessa hypoteser kan antingen vara hela meningen eller den del av meningen som ännu inte ska översättas.

Ökad översättning

Augmented translation är en form av mänsklig översättning som utförs inom en integrerad teknikmiljö som ger översättare tillgång till undersegment adaptiv maskinöversättning (MT) och översättningsminne (TM), terminologiuppslagning (CAT) och automatisk innehållsberikning (ACE) för att hjälpa deras arbete, och som automatiserar projektledning, filhantering och andra tilläggsuppgifter.

Baserat på begreppet augmented reality försöker augmented translation göra översättare mer produktiva genom att ge dem relevant information vid behov. Denna information anpassar sig till vanorna och stilen hos enskilda översättare för att påskynda deras arbete och öka produktiviteten. Det skiljer sig från klassisk postning av MT , som har lingvister reviderat hela texter översatta av maskiner, genom att det ger maskinöversättning och information som förslag som kan antas i sin helhet, redigeras eller ignoreras, efter behov.

Augmented translation utökar principer som först utvecklades på 1980 -talet och som tog sig in i CAT -verktyg. Det integrerar emellertid flera funktioner som tidigare varit diskreta i en miljö. Till exempel har översättare historiskt sett varit tvungna att lämna sina översättningsmiljöer för att göra terminologi, men i en förstärkt miljö skulle en ACE -komponent automatiskt ge länkar till information om termer och begrepp som finns i texten direkt i miljön.

I maj 2017 finns det inga fullständiga implementeringar av en förstärkt översättningsmiljö, även om enskilda utvecklare har skapat partiella system.

Se även

Referenser

externa länkar