Google översätt - Google Translate

Google översätt
Google Translate logo.svg
Skärmdump av Google Translate.png
Google Translate -hemsida
Typ av webbplats
Neural maskinöversättning
Tillgänglig i 109 språk, se nedan
Ägare Google
URL översätt .google .com
Kommersiell Ja
Registrering Frivillig
Användare Över 500 miljoner människor dagligen
Lanserad 28 april 2006 ; 15 år sedan (som statistisk maskinöversättning ) 15 november 2016 ; 4 år sedan (som neural maskinöversättning ) ( 2006-04-28 )
 ( 2016-11-15 )
Nuvarande status Aktiva

Google Translate är en flerspråkig neural maskinöversättningstjänst som utvecklats av Google för att översätta text, dokument och webbplatser från ett språk till ett annat. Det erbjuder ett webbplatsgränssnitt , en mobilapp för Android och iOS och ett programprogrammeringsgränssnitt som hjälper utvecklare att bygga webbläsartillägg och program . Från och med oktober 2021 stöder Google Translate 109 språk på olika nivåer och i april 2016 krävde över 500 miljoner användare totalt, med mer än 100 miljarder ord översatta dagligen.

Den lanserades i april 2006 som en statistisk maskinöversättningstjänst och använde FN: s och Europaparlamentets dokument och transkript för att samla in språkliga data. Istället för att översätta språk direkt, översätter det först text till engelska och svänger sedan till målspråket i de flesta språkkombinationer som det ger i sitt rutnät, med några få undantag inklusive katalansk-spanska. Under en översättning letar det efter mönster i miljontals dokument för att avgöra vilka ord som ska väljas och hur de ska ordnas på målspråket. Dess noggrannhet, som har kritiserats och förlöjligats vid flera tillfällen, har mätts variera kraftigt mellan olika språk. I november 2016 meddelade Google att Google Translate skulle byta till en neural maskinöversättningsmotor - Google Neural Machine Translation (GNMT) - som översätter "hela meningar åt gången, snarare än bara bit för bit. Den använder detta bredare sammanhang för att hjälpa det räkna ut den mest relevanta översättningen, som den sedan ordnar om och justerar för att mer likna en människa som talar med rätt grammatik ". Ursprungligen endast aktiverat för några språk 2016, används GNMT nu på alla 109 språk i Google Translate -listan från och med oktober 2021, förutom vid översättning mellan engelska och latin .

Historia

Google Translate är en kompletterande översättningstjänst som utvecklades av Google i april 2006. Den översätter flera former av texter och media, till exempel ord, fraser och webbsidor.

Ursprungligen släpptes Google Translate som en statistisk maskinöversättningstjänst . Inmatningstexten måste översättas till engelska innan den översattes till det valda språket. Eftersom SMT använder prediktiva algoritmer för att översätta text, hade den dålig grammatisk noggrannhet. Trots detta anställde Google inte experter för att lösa denna begränsning på grund av språkets ständigt utvecklande karaktär.

I januari 2010 introducerade Google en Android -app och iOS -version i februari 2011 för att fungera som en bärbar personlig tolk. I februari 2010 integrerades den i webbläsare som Chrome och kunde uttala den översatta texten, automatiskt känna igen ord i en bild och upptäcka okänd text och språk.

I maj 2014 förvärvade Google Word Lens för att förbättra kvaliteten på visuell och röstöversättning. Den kan skanna text eller en bild med enheten och få den översatt direkt. Dessutom identifierar systemet automatiskt främmande språk och översätter tal utan att individer behöver trycka på mikrofonknappen när talöversättning behövs.

I november 2016 överförde Google sin översättningsmetod till ett system som kallas neural maskinöversättning . Den använder djupinlärningsteknik för att översätta hela meningar åt gången, vilket har mätts för att vara mer exakt mellan engelska och franska, tyska, spanska och kinesiska. Inga mätresultat har tillhandahållits av Google -forskare för GNMT från engelska till andra språk, andra språk till engelska eller mellan språkpar som inte inkluderar engelska. Från och med 2018 översätter det mer än 100 miljarder ord om dagen.

Funktioner

Google Translate kan översätta flera former av text och media, vilket inkluderar text, tal och text inom stillbilder eller rörliga bilder. Specifikt inkluderar dess funktioner:

  • Översättning av skrivna ord: en funktion som översätter skrivna ord eller text till ett främmande språk.
  • Webbplatsöversättning: en funktion som översätter en hel webbsida till utvalda språk
  • Dokumentöversättning: en funktion som översätter ett dokument som laddats upp av användarna till utvalda språk. Dokumenten ska vara i form av: .doc, .docx, .odf, .pdf, .ppt, .pptx, .ps, .rtf, .txt, .xls, .xlsx.
  • Talöversättning: en funktion som direkt översätter talspråk till det valda främmande språket.
  • Översättning av mobilappar: 2018 har Google Translate introducerat sin nya funktion som heter "Tryck för att översätta", vilket gjorde omedelbar översättning tillgänglig i alla appar utan att stänga eller byta den.
  • Bildöversättning: en funktion som identifierar text i en bild som tagits av användarna och översätter text på skärmen direkt med bilder.
  • Handskriven översättning: en funktion som översätter språk som är handskrivna på telefonskärmen eller ritade på ett virtuellt tangentbord utan stöd av ett tangentbord.

För de flesta av dess funktioner tillhandahåller Google Translate uttalet, ordlistan och lyssnar på översättning. Dessutom har Google Translate introducerat sin egen Translate -app, så översättning är tillgänglig med en mobiltelefon i offline -läge.

Funktioner

Google Translate producerar approximationer på flera språk av flera former av text och media, inklusive text, tal, webbplatser eller text som visas i stillbilder eller livevideobilder. För vissa språk kan Google Translate syntetisera tal från text, och i vissa par är det möjligt att markera specifika motsvarande ord och fraser mellan källan och måltexten. Resultaten visas ibland med dikterad information under översättningsrutan, men det är inte en ordbok och har visat sig hitta översättningar på alla språk för ord som den inte känner igen. Om "Upptäck språk" är valt kan text på ett okänt språk identifieras automatiskt. I webbgränssnittet kan användare föreslå alternativa översättningar, till exempel för tekniska termer, eller rätta till misstag. Dessa förslag kan ingå i framtida uppdateringar av översättningsprocessen. Om en användare anger en URL i källtexten kommer Google Translate att skapa en hyperlänk till en maskinöversättning av webbplatsen. Användare kan spara översättningsförslag i en "frasbok" för senare användning. För vissa språk kan text matas in via ett tangentbord på skärmen , genom handskriftsigenkänning eller taligenkänning . Det är möjligt att ange sökningar på ett källspråk som först översätts till ett målspråk så att man kan bläddra och tolka resultat från det valda destinationsspråket på källspråket.

Texter skrivna i grekiska , Devanagari , kyrilliska och arabiska skript kan automatiskt translittereras från fonetiska ekvivalenter skrivna i det latinska alfabetet . Webbläsarversionen av Google Translate ger läset fonetiskt för japansk till engelsk konvertering. Samma alternativ är inte tillgängligt för den betalda API -versionen.

Engelska accent som "text-till-tal" -ljudet från Google Translate i varje land använder:
  Brittiska (mottaget uttal) (kvinna)
  General American (kvinna)
  General Australian (kvinna)
  Indisk (kvinna)
  Ingen Google translate -tjänst

Många av de mer populära språken har en "text-till-tal" ljudfunktion som kan läsa upp en text på det språket, upp till några dussin ord eller så. När det gäller pluricentriska språk beror accenten på regionen: för engelska, i Amerika , större delen av Asien-Stillahavsområdet och Västasien , använder ljudet en kvinnlig generalamerikansk accent, medan i Europa, Hong Kong , Malaysia , Singapore , Guyana och alla andra delar av världen används en kvinnlig brittisk ( mottaget uttal ) accent, med undantag för en speciell general australisk accent som används i Australien, Nya Zeeland och Norfolk Island , och en indisk engelsk accent som används i Indien; för spanska, i Amerika används en latinamerikansk accent, medan i andra delar av världen används en kastiliansk accent; för portugisiska används en São Paulo -accent runt om i världen, utom i Portugal, där deras infödda accent används istället; för franska används en Quebecois -accent i Kanada, medan i andra delar av världen används en vanlig europeisk accent ; för bengali används en manlig bangladeshisk accent, förutom i Indien, där en speciell indisk bengalisk kvinnlig accent används istället. Vissa mindre talade språk använder eSpeak- syntetiseraren med öppen källkod för sitt tal; producerar en robotisk, besvärlig röst som kan vara svår att förstå.

Webbläsarintegration

Google Translate är tillgängligt i vissa webbläsare som ett valfritt tillägg som kan laddas ner som kan köra översättningsmotorn, vilket gör det möjligt att högerklicka på kommandoåtkomst till översättningstjänsten. I februari 2010 integrerades Google Translate som standard i webbläsaren Google Chrome för automatisk översättning av webbsidor som tillval.

Mobil app

Google översätt
Google Translate logo.svg
Skärmdump
Google Translate iOS -app screenshot.png
En skärmdump av iOS -appen för Google Translate, som visar en engelsk översättning av "Coffee" till förenklad kinesiska "咖啡" eller "Kāfēi"
Utvecklare Google
Initial release 1 januari 2010 ; 11 år sedan (för Android) 8 februari 2011 ; För 10 år sedan (för iOS) ( 2010-01-01 )
 ( 2011-02-08 )
Stabil frisläppning (ar) [±]
Android 6.5.0.RC04.292618770 / 31 januari 2020 ; 20 månader sedan ( 2020-01-31 )
iOS 6.3.0 / 3 oktober 2019 ; 2 år sedan ( 2019-10-03 )
Plattform
Storlek 20,74 MB (Android)
70,9 MB (iOS)
Tillgänglig i 109 språk, se nedan
Typ Statistisk och neural maskinöversättning
Hemsida m .translate .google .com

Google Translate -appen för Android och iOS stöder 109 språk och kan föreslå översättningar för 37 språk via foto, 32 via röst i "konversationsläge" och 27 via levande videobilder i "augmented reality -läge".

Android -appen släpptes i januari 2010, medan en HTML5 -webbapplikation släpptes för iOS -användare i augusti 2008, följt av en inbyggd app den 8 februari 2011.

Appen stöder 109 språk och röstinmatning för 45 språk. Den är tillgänglig för enheter som kör Android 2.1 och senare och kan laddas ner genom att söka efter "Google Translate" i Google Play .

Den nuvarande Google Translate -appen är kompatibel med iPhone , iPad och iPod Touch uppdaterad till iOS 7.0+. Den accepterar röstinmatning för 15 språk och tillåter översättning av ett ord eller en fras till ett av mer än 50 språk. Översättningar kan talas högt på 23 olika språk.

En Android -version från januari 2011 experimenterade med ett "konversationsläge" som syftar till att låta användare kommunicera flytande med en närliggande person på ett annat språk. Ursprungligen begränsad till engelska och spanska, fick funktionen stöd för 12 nya språk, fortfarande under testning, följande oktober.

Funktionen "Kamerainmatning" gör det möjligt för användare att ta ett foto av ett dokument, skylt, etc. Google Translate känner igen texten från bilden med hjälp av optisk teckenigenkänning (OCR) -teknologi och ger översättningen. Kamerainmatning är inte tillgänglig för alla språk.

I januari 2015 fick apparna möjlighet att föreslå översättningar av fysiska tecken i realtid med enhetens kamera, som ett resultat av Googles förvärv av Word Lens -appen. Den ursprungliga lanseringen i januari stödde bara sju språk, men en uppdatering i juli lade till stöd för 20 nya språk, med lanseringen av en ny implementering som använder konvolutionella neurala nätverk , och förbättrade också hastigheten och kvaliteten på konversationslägesöversättningar ( augmented reality ). Funktionen döptes därefter om till Instant Camera. Tekniken som ligger till grund för Instant Camera kombinerar bildbehandling och optisk teckenigenkänning och försöker sedan producera tvärspråkiga ekvivalenter med hjälp av vanliga Google Translate-uppskattningar för texten som den uppfattas.

Den 11 maj 2016 introducerade Google Tap to Translate för Google Translate för Android. Vid markering av text i en app som är på ett främmande språk kommer Translate att dyka upp inuti appen och erbjuda översättningar.

API

Den 26 maj 2011 meddelade Google att Google Translate API för mjukvaruutvecklare hade föråldrats och skulle sluta fungera. Översätt API -sidan angav orsaken som "betydande ekonomisk börda orsakad av omfattande övergrepp" med ett slutdatum som fastställts den 1 december 2011. Som svar på offentligt tryck meddelade Google i juni 2011 att API: et fortsätter att vara tillgängligt som betalt service.

Eftersom API: et användes på många tredjepartswebbplatser och -appar, ledde det ursprungliga beslutet att avskriva det några utvecklare att kritisera Google och ifrågasätta livskraften att använda Google API: er i sina produkter.

Google Assistant

Google Translate tillhandahåller också översättningar för Google Assistant och de enheter som Google Assistant kör på, till exempel Google Home och Pixel Buds .

Språk som stöds

Från och med oktober 2021 stöds följande 109 språk av Google Translate.

Historia
  1. 1: a etappen
    1. Engelska till och från franska
    2. Engelska till och från tyska
    3. Engelska till och från spanska
  2. 2: a etappen
    1. Engelska till och från portugisiska
  3. 3: e etappen
    1. Engelska till och från italienska
  4. 4: e etappen
    1. Engelska till och från kinesiska (förenklat)
    2. Engelska till och från japanska
    3. Engelska till och från koreanska
  5. 5: e etappen (lanserades 28 april 2006)
    1. Engelska till och från arabiska
  6. 6: e etappen (lanserades 16 december 2006)
    1. Engelska till och från ryska
  7. 7: e etappen (lanserades 9 februari 2007)
    1. Engelska till och från kinesiska (traditionell)
    2. Kinesiska (förenklat till och från traditionellt)
  8. 8: e etappen (alla 25 språkpar använder Googles maskinöversättningssystem) (lanserades 22 oktober 2007)
    1. Engelska till och från nederländska
    2. Engelska till och från grekiska
  9. 9: e etappen
    1. Engelska till och från hindi
  10. 10: e etappen (från och med detta skede kan översättning göras mellan två språk, med hjälp av engelska som ett mellansteg, om det behövs) (lanserades 8 maj 2008)
    1. Bulgariska
    2. Kroatisk
    3. Tjeckiska
    4. Danska
    5. Finska
    6. Norska ( bokmål )
    7. putsa
    8. Rumänska
    9. svenska
  11. 11: e etappen (lanserades 25 september 2008)
    1. Katalanska
    2. Filippinare
    3. Hebreiska
    4. Indonesiska
    5. Lettiska
    6. Litauiska
    7. Serbiska
    8. Slovakiska
    9. Slovenska
    10. Ukrainska
    11. Vietnamesiska
  12. 12: e etappen (lanserad 30 januari 2009)
    1. Albanska
    2. Estniska
    3. Galiciska
    4. Ungerska
    5. Maltesiska
    6. Thai
    7. Turkiska
  13. 13: e etappen (lanserad 19 juni 2009)
    1. Persiska
  14. 14: e etappen (lanserades 24 augusti 2009)
    1. Afrikaans
    2. Vitryska
    3. Isländska
    4. Irländska
    5. Makedonska
    6. Malaysiska
    7. Swahili
    8. Walesiska
    9. Jiddisch
  15. 15: e etappen (lanserades 19 november 2009)
    1. Beta -etappen är klar. Användare kan nu välja att få romaniseringen skriven för vitryska, bulgariska, kinesiska, grekiska, hindi, japanska, koreanska, ryska, thailändska och ukrainska. För översättningar från arabiska, hindi och persiska kan användaren ange en latinsk translitteration av texten och texten kommer att translittereras till det inbyggda skriptet för dessa språk när användaren skriver. Texten kan nu läsas av ett text-till-tal- program på engelska, franska, tyska och italienska.
  16. 16: e etappen (lanserad 30 januari 2010)
    1. haitisk kreol
  17. 17: e etappen (lanserades april 2010)
    1. Talprogram lanserades på hindi och spanska.
  18. 18: e etappen (lanserades 5 maj 2010)
    1. Talprogram startade på afrikaans, albanska, katalanska, kinesiska (mandarin), kroatiska, tjeckiska, danska, nederländska, finska, grekiska, ungerska, isländska, indonesiska, lettiska, makedonska, norska, polska, portugisiska, rumänska, ryska, serbiska, slovakiska , Swahili, svenska, turkiska, vietnamesiska och walisiska (baserat på eSpeak )
  19. 19: e etappen (lanserades 13 maj 2010)
    1. Armeniska
    2. Azerbajdzjanska
    3. Baskiska
    4. Georgiska
    5. Urdu
  20. 20: e etappen (lanserades juni 2010)
    1. Ger romanisering för arabiska.
  21. 21: e etappen (lanserades september 2010)
    1. Tillåter fonetisk typning för arabiska, grekiska, hindi, persiska, ryska, serbiska och urdu.
    2. Latin
  22. 22: e etappen (lanserades december 2010)
    1. Romanisering av arabiska har tagits bort.
    2. Stavningskontroll har lagts till.
    3. För vissa språk ersatte Google text-till-tal-syntetiserare från eSpeaks robotröst till infödda talares naturröstteknologier gjorda av SVOX (kinesiska, tjeckiska, danska, nederländska, finska, grekiska, ungerska, norska, polska, portugisiska, ryska, svenska, Turkiska), och även de gamla versionerna av franska, tyska, italienska och spanska; Latin använder samma synthesizer som italienska.
    4. Talprogram lanserades på arabiska, japanska och koreanska.
  23. 23: e etappen (lanserades januari 2011)
    1. Val av olika översättningar för ett ord.
  24. 24: e etappen (lanserades juni 2011)
    1. 5 nya indiska språk (i alfa) och en translittererad inmatningsmetod:
    2. Bengali
    3. Gujarati
    4. Kannada
    5. Tamil
    6. Telugu
  25. 25: e etappen (lanserades juli 2011)
    1. Översättningsbetyg infördes.
  26. 26: e etappen (lanserades januari 2012)
    1. Holländsk manlig röstsynthesizer ersatt med kvinnlig.
    2. Elena av SVOX ersatte den slovakiska eSpeak -rösten.
    3. Translitteration av jiddisch tillagd.
  27. 27: e etappen (lanserades februari 2012)
    1. Talprogram lanserades på thailändska.
    2. Esperanto
  28. 28: e etappen (lanserades september 2012)
    1. Lao
  29. 29: e etappen (lanserades oktober 2012)
    1. Translitteration av Lao tillagd. (alfastatus)
  30. 30: e etappen (lanserades oktober 2012)
    1. Nytt talprogram lanserades på engelska.
  31. 31: e etappen (lanserades november 2012)
    1. Nytt talprogram på franska, tyska, italienska, latin och spanska.
  32. 32: e etappen (lanserades i mars 2013)
    1. Frasbok tillagd.
  33. 33: e etappen (lanserades april 2013)
    1. Khmer
  34. 34: e etappen (lanserades i maj 2013)
    1. Bosniska
    2. Cebuano
    3. Hmong
    4. Javanesiska
    5. Marathi
  35. 35: e etappen (lanserades maj 2013)
    1. 16 ytterligare språk kan användas med kamerainmatning: bulgariska, katalanska, kroatiska, danska, estniska, finska, ungerska, indonesiska, isländska, lettiska, litauiska, norska, rumänska, slovakiska, slovenska och svenska.
  36. 36: e etappen (lanserades december 2013)
    1. Hausa
    2. Igbo
    3. Maori
    4. Mongoliska
    5. Nepali
    6. Punjabi ( Gurmukhi )
    7. Somaliska
    8. Yoruba
    9. Zulu
  37. 37: e etappen (lanserades juni 2014)
    1. Definition av ord tillagda.
  38. 38: e etappen (lanserades december 2014)
    1. Burmesiska
    2. Chewa
    3. Kazakiska
    4. Madagaskisk
    5. Malayalam
    6. Singalesiska
    7. Sotho
    8. Sundaneser
    9. Tadzjikiska
    10. Uzbekiska
  39. 39: e etappen (lanserades oktober 2015)
    1. Translitteration av arabiska återställd.
  40. 40: e etappen (lanserades november 2015)
    1. Aurebesh
  41. 41: e etappen (lanserades februari 2016)
    1. Aurebesh tas bort.
    2. Talprogram lanserades på bengali.
    3. Amhariska
    4. Korsikanska
    5. Hawaiian
    6. Kurdiska ( Kurmanji )
    7. Kirgisiska
    8. Luxemburgska
    9. Pashto
    10. Samoanska
    11. Skotsk gæliska
    12. Shona
    13. Sindhi
    14. Västfrisiska
    15. Xhosa
  42. 42: e etappen (lanserades september 2016)
    1. Talprogram lanserades på ukrainska.
  43. 43: e etappen (lanserades december 2016)
    1. Talprogram lanserades i Khmer och Sinhala.
  44. 44: e etappen (lanserades juni 2018)
    1. Talprogram lanserades på burmesiska, malayalam, marathi, nepalesiska och telugu.
  45. 45: e etappen (lanserades september 2019)
    1. Talprogram lanserades i Gujarati, Kannada och Urdu.
  46. 46: e etappen (lanserades februari 2020)
    1. Kinyarwanda
    2. Odia
    3. Tatariska
    4. Turkmener
    5. Uyghur
  47. 47: e etappen (lanserades februari 2021)
    1. Talprogram lanserades på afrikaans, bulgariska, katalanska, isländska, lettiska, malaysiska och serbiska (ändrat från eSpeak till en naturlig röst).
    2. Nytt talsystem (WaveNet) för flera språk.

Språk i utveckling och betaversion

Följande språk stöds ännu inte av Google Translate, men är tillgängliga i Translate Community. Från och med oktober 2021 finns det 126 språk under utveckling och 25 av dem är i betaversion .

Språken i betaversionen är närmare deras publicering och har ett exklusivt extra alternativ att bidra med som gör det möjligt att utvärdera upp till 4 översättningar av betaversionen genom att översätta en engelsk text med upp till 50 tecken.

Språk begärde, men ännu inte att läggas till

Översättningsmetodik

I april 2006 lanserades Google Translate med en statistisk maskinöversättningsmotor.

Google Translate tillämpar inte grammatiska regler, eftersom dess algoritmer är baserade på statistisk eller mönsteranalys snarare än traditionell regelbaserad analys. Systemets ursprungliga skapare, Franz Josef Och , har kritiserat effektiviteten hos regelbaserade algoritmer till förmån för statistiska metoder. Originalversioner av Google Translate baserades på en metod som kallades statistisk maskinöversättning , och mer specifikt, på forskning av Och som vann DARPA -tävlingen för snabbmaskinöversättning 2003. Och var chef för Googles maskinöversättningsgrupp tills han gick med i Human Longevity. , Inc. i juli 2014.

Google Translate översätter inte från ett språk till ett annat (L1 → L2). Istället översätts det ofta först till engelska och sedan till målspråket (L1 → EN → L2). Men eftersom engelska, liksom alla mänskliga språk, är tvetydigt och beror på kontext, kan detta orsaka översättningsfel. Till exempel, översätta vous från franska till ryska ger vous → du → ты OR Bы/вы . Om Google använde ett entydigt, konstgjort språk som mellanhand, skulle det vara dig → du → Bы/вы ELLER tu → du → ты . En sådan ordsuffix fördubblar deras olika betydelser. Därför publicerar man på engelska, använder entydiga ord, ger sammanhang, använder uttryck som "ni alla" ofta en bättre översättning i ett steg.

Följande språk har ingen direkt Google -översättning till eller från engelska. Dessa språk översätts genom det angivna mellanliggande språket (som i de flesta fall är nära besläktat med det önskade språket men mer allmänt talat) förutom genom engelska:

Enligt Och skulle en solid bas för att utveckla ett användbart statistiskt maskinöversättningssystem för ett nytt par språk från grunden bestå av en tvåspråkig textkorpus (eller parallell samling ) med mer än 150-200 miljoner ord och två enspråkiga korpor vardera av mer än en miljard ord. Statistiska modeller från dessa data används sedan för att översätta mellan dessa språk.

För att skaffa sig denna enorma mängd språkliga data använde Google FN och Europaparlamentets dokument och utskrifter. FN publicerar vanligtvis dokument på alla sex officiella FN-språken , vilket har tagit fram en mycket stor korps på 6 språk.

När Google Translate genererar ett översättningsförslag letar det efter mönster i hundratals miljoner dokument som hjälper till att bestämma den bästa översättningen. Genom att upptäcka mönster i dokument som redan har översatts av mänskliga översättare gör Google Translate informerade gissningar (AI) om vad en lämplig översättning ska vara.

Före oktober 2007, för andra språk än arabiska , kinesiska och ryska , var Google Translate baserat på SYSTRAN , en mjukvarumotor som fortfarande används av flera andra översättningstjänster online, till exempel Babel Fish (nu nedlagd). Från oktober 2007 använde Google Translate istället egenutvecklad, intern teknik baserad på statistisk maskinöversättning , innan den övergick till neural maskinöversättning.

Google Translate Community

Google har crowdsourcingfunktioner för volontärer att vara en del av dess "Translate Community", avsett att hjälpa till att förbättra Google Översätts noggrannhet. Volontärer kan välja upp till fem språk för att förbättra översättningen; användare kan verifiera översatta fraser och översätta fraser på sina språk till och från engelska, vilket hjälper till att förbättra noggrannheten i översättning av mer sällsynta och komplexa fraser. I augusti 2016 släpptes en Google Crowdsource -app för Android -användare, där översättningsuppgifter erbjuds. Det finns tre sätt att bidra. Först kommer Google att visa en fras som man bör skriva i den översatta versionen. För det andra visar Google en föreslagen översättning för en användare att godkänna, inte hålla med eller hoppa över. För det tredje kan användare föreslå översättningar för fraser där de tror att de kan förbättra Googles resultat. Test på 44 språk visar att funktionen "föreslå en redigering" ledde till en förbättring i högst 40% av fallen under fyra år, medan analys över hela linjen visar att Googles publikprocedurer ofta minskar felaktiga översättningar.

Statistisk maskinöversättning

Även om Google implementerade ett nytt system som kallas neural maskinöversättning för bättre översättning, finns det språk som fortfarande använder den traditionella översättningsmetoden som kallas statistisk maskinöversättning. Det är en regelbaserad översättningsmetod som använder prediktiva algoritmer för att gissa sätt att översätta texter på främmande språk. Det syftar till att översätta hela fraser snarare än enstaka ord och sedan samla överlappande fraser för översättning. Dessutom analyserar den också tvåspråkiga textkorpor för att generera statistisk modell som översätter texter från ett språk till ett annat.

Google Neural Machine Translation

I september 2016 tillkännagav ett forskargrupp på Google utvecklingen av Google Neural Machine Translation System (GNMT) för att öka flyt och noggrannhet i Google Translate och i november meddelade att Google Translate skulle byta till GNMT.

Google Översätts neurala maskinöversättningssystem använder ett stort artificiellt neuralt nätverk från slutet till slutet som försöker utföra djupinlärning , särskilt långa korttidsminnesnätverk . GNMT förbättrar översättningskvaliteten över SMT i vissa fall eftersom den använder en exempelbaserad maskinöversättningsmetod (EBMT) där systemet "lär sig av miljontals exempel". Enligt Google -forskare översätter den "hela meningar åt gången, snarare än bara bit för bit. Den använder detta bredare sammanhang för att hjälpa den att ta reda på den mest relevanta översättningen, som den sedan ordnar om och justerar för att mer likna en människa som talar med korrekt grammatik". GNMT: s "föreslagna arkitektur" för "systeminlärning" har implementerats på över hundra språk som stöds av Google Translate. Med end-to-end-ramverket säger Google men visar inte för de flesta språk att "systemet lär sig med tiden att skapa bättre, mer naturliga översättningar." GNMT-nätverket försöker flerspråkig maskinöversättning , som kodar för "meningens semantik snarare än att bara memorera fras-till-fras-översättningar", och systemet uppfann inte sitt eget universella språk, utan använder "det gemensamma som finns mellan många språk" . GNMT aktiverades först för åtta språk: till och från engelska och kinesiska, franska, tyska, japanska, koreanska, portugisiska, spanska och turkiska. I mars 2017 aktiverades det för hindi, ryska och vietnamesiska, följt av bengali, gujarati, indonesiska, kannada, malayalam, marathi, punjabi, tamil och telugu i april.

Noggrannhet

Google Translate är inte lika tillförlitlig som mänsklig översättning. När texten är välstrukturerad, skriven med formellt språk, med enkla meningar, relaterade till formella ämnen för vilka utbildningsdata är riklig, producerar den ofta konverteringar som liknar mänskliga översättningar mellan engelska och ett antal språk med hög resurs. Noggrannheten minskar för dessa språk när färre av dessa villkor gäller, till exempel när meningslängden ökar eller texten använder bekant eller litterärt språk. För många andra språk gentemot engelska kan det ge upphov till text i de formella omständigheterna. Mänsklig utvärdering från engelska till alla 102 språk visar att huvudidén med en text förmedlas mer än 50% av tiden för 35 språk. För 67 språk uppnås inte ett minimalt begripligt resultat 50% av tiden eller mer. Några studier har utvärderat kinesiska, franska, tyska och spanska till engelska, men ingen systematisk mänsklig utvärdering har gjorts från de flesta språk från Google Translate till engelska. Spekulativa språk-till-språk-poäng som extrapoleras från engelska-till-andra mätningar indikerar att Google Translate kommer att ge översättningsresultat som förmedlar kärnan i en text från ett språk till ett annat mer än halva tiden i cirka 1% av språkpar, där ingen av dem språket är engelska.

När det används som en ordbok för att översätta enskilda ord, är Google Translate mycket felaktigt eftersom det måste gissa mellan polysemiska ord . Bland de 100 bästa orden på det engelska språket, som utgör mer än 50% av all skriven engelska, har det genomsnittliga ordet mer än 15 sinnen, vilket gör oddsen mot en korrekt översättning cirka 15 till 1 om varje förnuft kartlägger till ett annat ord på målspråket. De vanligaste engelska orden har minst två sinnen, vilket ger 50/50 odds i det troliga fallet att målspråket använder olika ord för de olika sinnena. Oddsen är lika från andra språk till engelska. Google Translate gör statistiska gissningar som ökar sannolikheten för att få fram ett ord som är vanligast, med följden att en korrekt översättning blir otillgänglig i fall som inte matchar majoriteten eller flertalet korpusförekomst . Noggrannheten i enskilda ordsprognoser har inte mätts för något språk. Eftersom nästan alla icke-engelska språkpar svänger genom engelska kan oddsen mot att erhålla exakta enkelordsöversättningar från ett icke-engelska språk till ett annat uppskattas genom att multiplicera antalet sinnen på källspråket med antalet sinnen var och en av dessa termer har på engelska. När Google Translate inte har ett ord i sitt ordförråd utgör det ett resultat som en del av dess algoritm.

Google Översätts felaktigheter kan illustreras genom att översätta från ett språk till ett annat och sedan tillbaka till originalspråket. Detta kommer ofta att resultera i meningslösa konstruktioner, snarare att återställa originaltexten.

Begränsningar

Google Translate har, liksom andra automatiska översättningsverktyg, sina begränsningar. Tjänsten begränsar antalet stycken och utbudet av tekniska termer som kan översättas, och även om det kan hjälpa läsaren att förstå det allmänna innehållet i en främmande språktext, levererar det inte alltid korrekta översättningar, och de flesta gånger tenderar det att upprepas ordagrant samma ord som det förväntas översätta. Grammatiskt, till exempel, kämpar Google Translate med att skilja mellan ofullkomliga och perfekta aspekter på romantiska språk så vanliga och kontinuerliga handlingar i det förflutna blir ofta enstaka historiska händelser. Även om det verkar vara pedantiskt kan detta ofta leda till felaktiga resultat (till en modersmål på till exempel franska och spanska) som skulle ha undvikits av en mänsklig översättare. Kunskap om konjunktivstämningen är praktiskt taget obefintlig. Dessutom väljs den formella andra personen ( vous ) ofta, oavsett sammanhang eller accepterad användning. Eftersom det engelska referensmaterialet bara innehåller "du" -formulär har det svårt att översätta ett språk med "ni alla" eller formella "ni" -varianter.

På grund av skillnader mellan språk i investeringar, forskning och omfattningen av digitala resurser, varierar noggrannheten i Google Translate mycket mellan olika språk. Vissa språk ger bättre resultat än andra. De flesta språk från Afrika, Asien och Stilla havet tenderar att göra dåliga poäng i förhållande till många välfinansierade europeiska språk. Inga språk som är inhemska i Australien eller Amerika ingår i Google Translate. Högre poäng för europeiska kan delvis tillskrivas Europarl Corpus , en mängd dokument från Europaparlamentet som har översatts professionellt av Europeiska unionens mandat till så många som 21 språk. En analys från 2010 visade att översättning från franska till engelska är relativt korrekt och 2011 och 2012 analyser visade att översättning från italienska till engelska också är relativt korrekt. Men om källtexten är kortare fungerar regelbaserade maskinöversättningar ofta bättre. denna effekt är särskilt tydlig i kinesiska till engelska översättningar. Medan redigeringar av översättningar kan skickas, kan man inte på kinesiska specifikt redigera meningar som en helhet. Istället måste man redigera ibland godtyckliga teckenuppsättningar, vilket leder till felaktiga redigeringar. Ett bra exempel är ryska-till-engelska. Tidigare skulle man använda Google Translate för att göra ett utkast och sedan använda en ordbok och sunt förnuft för att rätta till de många misstagen. Från början av 2018 är Translate tillräckligt korrekt för att göra den ryska Wikipedia tillgänglig för dem som kan läsa engelska. Översättens kvalitet kan kontrolleras genom att lägga till den som ett tillägg till Chrome eller Firefox och tillämpa den på vänster språklänkar i alla Wikipedia -artiklar. Det kan användas som en ordbok genom att skriva in ord. Man kan översätta från en bok med en skanner och en OCR som Google Drive, men det tar cirka fem minuter per sida.

I funktionen för översättning av skrivna ord finns det en ordgräns för mängden text som kan översättas på en gång. Därför bör lång text överföras till ett dokumentformulär och översättas med funktionen Document Translate.

Dessutom, som alla automatiska översättningsprogram, kämpar Google Translate med polysemi (de flera betydelser ett ord kan ha) och flerordsuttryck (termer som har betydelser som inte kan förstås eller översättas genom att analysera de enskilda ordenheter som komponerar dem). Ett ord på ett främmande språk kan ha två olika betydelser i det översatta språket. Detta kan leda till felöversättningar.

Dessutom förblir grammatiska fel en stor begränsning för noggrannheten i Google Translate.

Licenser och komponenter med öppen källkod

Språk WordNet Licens
Albanska Albanet CC-BY 3.0/GPL 3
Arabiska Arabiskt Wordnet CC-BY-SA 3
Katalanska Flerspråkigt centralt förvar CC-BY-3.0
Kinesiska Kinesiska Wordnet Wordnet
Danska Dannet Wordnet
engelsk Princeton Wordnet Wordnet
Finska FinnWordnet Wordnet
Franska WOLF (WOrdnet Libre du Français) CeCILL-C
Galiciska Flerspråkigt centralt förvar CC-BY-3.0
Hebreiska Hebreiska Wordnet Wordnet
Hindi IIT Bombay Wordnet Indo Wordnet
Indonesiska Wordnet Bahasa MIT
Italienska MultiWordnet CC-BY-3.0
Japanska Japanska Wordnet Wordnet
Javanesiska Javanesiskt Wordnet Wordnet
Malaysiska Wordnet Bahasa MIT
Norska Norska Wordnet Wordnet
Persiska Persiska Wordnet Gratis att använda
putsa plWordnet Wordnet
Portugisiska OpenWN-PT CC-BY-SA-3.0
Spanska Flerspråkigt centralt förvar CC-BY-3.0
Thai Thai Wordnet Wordnet

Recensioner

Strax efter att översättningstjänsten lanserades för första gången vann Google en internationell tävling om maskinoversättning från engelska – arabiska och engelska – kinesiska.

Översättningsfel och konstigheter

Eftersom Google Translate använde statistisk matchning för att översätta, kan översatt text ofta innehålla uppenbarligen meningslösa och uppenbara fel, ibland byta vanliga termer mot liknande men icke -ekvivalenta vanliga termer på det andra språket eller invertera meningsbetydelse. Nyhetswebbplatser som Bad Translator och Translation Party har använt tjänsten för att producera humoristisk text genom att översätta fram och tillbaka mellan flera språk, liknande barnens speltelefon .

Om appen försöker översätta Monty Pythons " The Funniest Joke in the World " till engelska, returnerar tjänsten meddelandet "[FATAL ERROR]".

Domstolsanvändning

År 2017 användes Google Translate under en domstolsförhandling när domstolsombud vid Teesside Magistrates 'Court misslyckades med att boka en tolk för den kinesiska svaranden.

Se även

Referenser

externa länkar