- DeepL erbjuder mer naturliga och nyanserade översättningar i många språkpar, men täcker färre språk än Google Översätt.
- Google Translate vinner mark i antal språk, funktioner (röst, bild, hela webbplatser) och integration med andra tjänster.
- Tester med litterära, journalistiska och vetenskapliga texter visar att båda misslyckas och att mänskligt ägande förblir nyckeln.
- Kvaliteten på båda beror på deras neurala nätverk och från träningsdata börjar andra aktörer som Kagi eller plattformar som Taia konkurrera inom detta område.

i dag Att översätta texter är inte längre enbart professionella översättares uppgift....åtminstone för ett första utkast. Mellan webbplatser, appar och deltagare med IAVi har översättare överallt. Men när det gäller att välja mellan Google Translate och DeepLMed två av de största namnen i branschen är saker och ting inte längre så självklara.
Båda tjänsterna använder maskinöversättning baserad på artificiell intelligensDe har förbättrats enormt på bara några år och är gratis i sin grundversion. Ändå skiljer de sig åt i kvalitet, antal språk, extrafunktioner och framför allt i hur de hanterar olika typer av text: vardagligt, litterärt, journalistiskt eller vetenskapligt.
Vad är egentligen Google Translate och DeepL?
Google Translate Den har varit standardmaskinöversättaren för halva planeten i åratal. Den skapades långt före DeepL och är integrerad i Googles ekosystemwebbläsare (du kan aktivera automatisk översättning av sidor), Android, Chromium, Google Dokument, sökningar… Under en längre tid var det den nästintill obestridliga referensen för att översätta vad som helst på några sekunder, särskilt på grund av dess enorma språktäckning.
År 2016 tillkännagav Google ett stort teknologiskt språng med Googles neurala maskinöversättning (GNMT), dess neurala maskinöversättningssystem baserat på återkommande neurala nätverk (RNN)Dessa nätverk översätter inte längre ord för ord, utan snarare De tar hänsyn till meningens sammanhang och orden i närheten.Detta resulterade i ett betydande språng i smidighet och noggrannhet jämfört med tidigare statistiska system.
Kort därefter kom ytterligare en intern utveckling, den s.k. Zero-Shot-översättningvilket gjorde det möjligt för Google att översätta mellan språkpar även utan många direkta exempel. Detta uppnås genom vanliga vektorrepresentationerdär fraser från olika språk projiceras in i samma semantiska utrymme och nätverket lär sig att relatera dem utan behov av uttömmande exempel för varje språkkombination.
På andra sidan är DeepL, en yngre översättare (den lanserades 2017) men det Det fick snabbt ett rykte om sig att erbjuda mer naturliga översättningar.särskilt bland europeiska språk. Till skillnad från Google är deras sökmotor främst baserad på faltningsneuronnätverk och andra moderna djupinlärningsarkitekturer, speciellt optimerad för att fånga nyanser och komplexa meningsstrukturer.
DeepLs största styrka är dess nära relation med Linguee, en flerspråkig ordbok och sökmotor för översättningar mycket välkänt bland översättare. I åratal sammanställde Linguee miljontals meningspar från pålitliga källor (såsom europeiska institutioner eller officiella dokument) och Han klassificerade kvaliteten på dessa översättningar.Det gigantiska arkivet av högkvalitativa översättningssegment blev det perfekta utbildningsmaterialet för DeepL.

Det är ingen slump att DeepL har fått sitt namn från "Deep Learning" (se Ordlista med AI-termerDess neurala nätverk livnär sig på miljarder noggrant utvalda översättningssegment, som kommer från källor som Europaparlamentet, patent från internationella organisationer eller litterära texter. Med andra ord är det inte bara tekniken som spelar roll, utan också kvaliteten på undervisningsmaterialet som AI:n tränas med.
Maskinöversättning och artificiell intelligens: hur dessa maskiner tänker
Både Google Translate och DeepL är baserade på djupa neurala nätverk tränade på enorma mängder textDen allmänna idén är relativt enkel att förklara: systemet ser miljontals (eller miljarder) fraser på ett språk tillsammans med deras översättning på ett annat språk och lär sig statistiska mönster mellan de två.
I fallet med DeepL, deras neurala nätverk är inspirerade av hjärnans funktion: artificiella "neuroner" sammankopplade Neuroner som tar emot stimuli (ord, positioner, språkliga drag) aktiveras och sprider den aktiveringen genom hela nätverket. Varje neuron bestämmer vilka signaler den ska rikta in sig på. När en fras passerar genom systemet omvandlas den till ett mönster av aktiveringar som färdas genom nätverket och slutligen genererar ordföljd översatt till målspråket.
Inledningsvis, som företaget självt förklarar, Kvaliteten på översättningarna är ganska dålig.Men allt eftersom nätverket tränas med miljarder exempel justerar det vikter och kopplingar, så att Varje iteration förbättrar resultatet något. Med el tiempoDenna stegvisa förbättring leder ofta till resultat som verkar ha skrivits av en person.
Google, å sin sida, tillgriper också massiva neurala nätverk tränade på berg av dataMånga av dem hämtades från texter och översättningar som finns tillgängliga på webben. Enligt Macduff Hughes, teknisk chef på Google Translate, Mängden och variationen av data mellan två språk påverkar kvaliteten.Mellan väldigt olika språk (till exempel engelska och kinesiska eller japanska) behövs mycket mer information för att uppnå samma noggrannhetsnivå som mellan närliggande språk, såsom engelska och spanska.
Microsoft Bing Translator, även om den är mindre framträdande här (se Microsoft samarbetar med AI), har också anslutit sig till denna neurala våg. Företaget hävdar att dess neurala nätverk tillåter för att bättre förstå frasens övergripande sammanhang innan översättningen genereras, något som automatiserade system historiskt sett har kämpat med.
Språk som stöds: kvantitet kontra kvalitet
En av de största tvistepunkterna mellan Google Translate och DeepL är antalet tillgängliga språkHär har Google en stor fördel: dess översättare Den stöder mer än 100 språk.inklusive stora och minoritetsspråk, dialekter och regionala varianter. Det är den perfekta översättaren när du behöver något "ovanligt" som maori, baskiska eller språk från Asien och Afrika.
DeepL, å andra sidan, Den stöder betydligt färre språk.Under sina första år erbjöd företaget bara översättning mellan ett fåtal europeiska språk, och även om det gradvis har utökat sin katalog ligger det fortfarande långt efter Googles mer än hundra språk. Vid lanseringen översatte det bara sju språk; senare passerade det tio och fortsätter att växa, men det når fortfarande inte upp till Googles räckvidd.
detta Den kvantitativa nackdelen uppvägs delvis av kvalitetenEnligt olika interna och externa tester ger DeepL ofta ett resultat när det språkpar du är intresserad av stöds. mer naturligt och flytande än Googles, särskilt i kombinationer som engelska-tyska, engelska-franska eller engelska-spanska.
Till exempel, i en testbänk som heter BLEU (Bilingual Evaluation Understudy)Med hjälp av ett standardmått för att utvärdera maskinöversättning genom att jämföra maskinutdata med mänskliga översättningar, uppnådde DeepL betydligt högre poäng än Google i vissa språkpar. För engelska-tyska angavs värden runt [värden saknas]. 31,1 poäng för DeepL jämfört med 28,4 för Google, en relevant skillnad i denna typ av test.
Dessutom har DeepL utfört blinda utvärderingar med professionella översättareDe fick se översättningar genererade av olika system (inklusive Google, Microsoft och andra) utan att få veta vilken som var vilken, och de var tvungna att välja den bästa. Enligt företaget själva valdes DeepL-utdata. tre eller fyra gånger oftare än konkurrenternas i dessa jämförelser.
Tester med riktiga texter: från Don Quijote till coronaviruset
Utöver automatiserade mätvärden är det som verkligen testar en automatisk översättare hur den beter sig med verkliga och varierade texterOlika medier och experter har testat Google Translate och DeepL (och andra system) under ganska krävande förhållanden: litteratur, nyheter, ordspråk, vetenskapliga texter etc.
Ett klassiskt exempel som har använts är Början av "Don Quixote de la Mancha", av Miguel de CervantesDet är en text full av nyanser, ålderdomliga formuleringar och komplexa strukturer. Både Google och DeepL har allvarliga problem med att översätta den korrekt till engelska. ingen av dem lyser särskilt, även om det finns märkliga skillnader i hur var och en löser uttryck som ”levde för inte så länge sedan” eller ”greyhound runner”.
Något liknande händer med boot från "Hundra år av ensamhet" av Gabriel García MárquezI en välkänd jämförelse erbjöd DeepL ett alternativ som kunde anses vara något bättre vad gäller verbtempus och ton – till exempel en mer precis motsvarighet till "var tvungen att komma ihåg" – medan Google var något mer bokstavligt. Det här är nyanser som i litteraturen kan göra skillnaden mellan en acceptabel översättning och en som "låter konstig".
När vi gick ner till terrängen journalistiska texterSaker och ting förändras lite. Analys av nyheter från medier som The New York Times eller The Verge har visat att DeepL väljer vanligtvis mer naturliga uttryck i kontexten. (”got a break” kontra ”hade a break”, ”in a packed match” istället för ”in a full game”), medan Google tenderar mer mot en bokstavlighet som krockar med spanskan.
Det finns dock också fall där Google skryter om specifika detaljerTill exempel, att korrekt respektera versaler i varumärken som ”Modell 3” från Teslaeller genom att hantera vissa numeriska format väl. I tekniska eller informativa texter blir skillnaderna i kvalitet suddas ut, och ibland är båda översättningarna mycket lika.
Litterära texter: stil, naturlighet och snubblar
Ett av de tuffaste testerna för en maskinöversättare är litterär översättningVerk som Harry Potter och filosofens sten De har använts för att jämföra Google, Bing och DeepL ur professionella och akademiska översättares synvinkel.
I en specifik utvärdering analyserades hur de tre systemen översatte ett fragment med dialoger, beskrivningar och idiomatiska uttryck till spanska. Google erbjöd ett ganska förståeligt resultat.men med interpunktionsproblem (mellanslag, felaktig versalanvändning, accenter) och med en mindre litterär stil: uttryck som "det såg ut" istället för "det verkade", upprepningar som ”dussintals fester och fester” eller något klumpiga vändningar.
Förslaget till bing Det visade sig vara mer problematiskt: konkordansfel (använder den maskulina formen av "professor" när man hänvisar till en "profesora" [kvinnlig professor]), oöversatta ord som "tabby", osammanhängande meningar och bokstavliga uttalanden som gränsar till nonsens (”stjärnfall” istället för ”stjärnfall”). Sammantaget var texten mindre naturlig och mer förvirrande.
DeepLFör sin del genererade den en globalt förståelig översättning, men med registreringsfel och variantblandning (typiska latinamerikanska spanska frasvändningar, som ”¿cómo supo?”), utöver onaturliga uttryck som ”se veía clara arrugada” (hon såg tydligt rynkig ut), ”sniffó con rabia” (han snörvlade ilsket) eller ”sacudió su cabeza hacia atrás” (han skakade på huvudet bakåt). Återigen är det tydligt att motorn inte riktigt har bemästrat den stilistiska subtilitet som litteraturen kräver.
I det specifika testet var den professionella bedömningen att Googles version var den "minst dåliga"följt av DeepL, med Bing som får sämst betyg. Det underliggande budskapet är tydligt: även med AI och neurala nätverk, den Litterär översättning är fortfarande ett mycket svårt område för maskiner..
Nyhets- och informativt språk: naturlighet kontra viktiga fel
Med aktuella nyhetsartiklar, till exempel en nyhetsartikel om Evakuering av kryssningsfartyg på grund av coronavirusutbrottSkillnaderna mellan översättarna blir mer subtila men inte mindre viktiga.
I en jämförelse erbjöd Google Translate en översättning som Den förmedlade det allmänna budskapet korrekt.Även om det finns uttryck som inte är typiska för spanska från Spanien, såsom ”luego de” istället för ”después de”, och vissa detaljer med förbättrad precision, såsom att översätta ”kryssningsfartyg” i plural när det i själva verket syftade på en enda specifik kryssning.
Bing visade återigen problem med naturlighet och konstruktion: "under lockdown" kontra "under isolering"Exempel inkluderar ”testades igen” istället för ”han testades igen”, eller dåligt konstruerade fraser som ”dockad på grund av coronavirus” där det borde ha varit ”påverkad av coronaviruset”. Dessa är små fel som, tillsammans, ger intrycket av tydligt automatiserad text.
Översättningen av DeepL I så fall hade den en viktig sak till sin fördel: behöll den korrekta singularformen för "kryssning"Han gjorde dock ett nästan ödesdigert misstag i en hälsonyhetsartikel: han översatte ”coronavirus” som "koronärt virus"Detta är en annan medicinsk term som helt flyttar fokus för informationen. Dessutom använde han "amerikaner" för att referera till medborgare i USA, något som vanligtvis undviks i formell journalistisk text på halvöspanska.
Sammantaget drog experterna slutsatsen att Ingen av de tre översättningarna var verkligen publicerbara utan mänsklig granskning.De kunde förstås, visst, men de uppvisade alla problem med stil, nyanser och terminologi som en professionell skribent skulle behöva finslipa innan han tog dem till en tidning.
Vetenskaplig text: när terminologin inte kan misslyckas
Nästa nivå av efterfrågan kommer med vetenskapliga texterdär en minimal avvikelse i en term kan förändra hela betydelsen. I ett test med en artikel om Försurning av hav och korallrevResultaten från Google, Bing och DeepL jämfördes igen.
I detta sammanhang Google Translate Han gjorde ett hyfsat gediget jobb: översättningen var flytande, lätt att förstå och Viktig terminologi (aragonit, biomineralisering, förkalkning etc.) var väl översatt.De fel som upptäcktes begränsades huvudsakligen till ordningen på vissa element i meningen eller till strukturer som var för nära knutna till engelskan, vilket en mänsklig korrekturläsare lätt skulle kunna korrigera.
bing Den gav ett liknande resultat: en något stel stil, kopierad från det engelska originalet, men med mestadels korrekt vetenskaplig terminologiDet fanns fraser som behövde en stilgranskning för tydlighetens skull, men inga allvarliga innehållsfel var uppenbara.
DeepLDen slog dock fel precis där den inte borde ha gjort det. Till exempel, i huvuduttalandet översattes något som motsvarar "Tillsatsen av koldioxid undertrycker nettoförkalkningen i samhället"ändrade elementens ordning och skapade en konceptuell härva. Dessutom introducerades uttryck som "minskningar av aragonitens mättnadstillstånd i den närmaste framtiden", en märklig konstruktion som en forskare eller granskare praktiskt taget skulle behöva bygga om från grunden.
I vetenskapliga dokument, där konsekvenserna av ett missförstånd är större, var experterna mycket tydliga: Ingen av dessa översättningar bör publiceras utan professionell efterredigering.För rapporter, artiklar eller innehåll med högt ansvarstagande kan maskinöversättning bara vara utgångspunkten.
Vardagliga uttryck, ordspråk och språkblandning
Om litteratur är komplicerad, vardagligt språk och ordspråk De är ett veritabelt minfält. Uttryck som ”att vinna dagen”, ”det finns ingen väg runt det” eller ”varken här eller där” är perfekta exempel på hur En bokstavlig översättning kan förstöra betydelsen..
I uttryck som "för att vinna dagen"vars verkliga betydelse är ”att segra” eller ”att uppnå något svårt”, tenderar Google Translate att översätt ord för ordvilket resulterar i fraser som en engelsk modersmålstalare inte skulle förstå. DeepL och andra mer avancerade system, som Kagi, kan föreslå motsvarande uppsättningsfraser på målspråket, vilket ger en mycket mer naturlig översättning.
Men som svar på fraser som "Jag försökte, men det var förgäves."Nästan alla system misslyckas och erbjuder meningslösa resultat, förutom nyare AI-motorer som kombinerar stora språkmodeller med maskinöversättning. Med andra ord, "varken för dig eller mig"Google och vissa konkurrenter får rätt med "Varken för dig eller för mig", medan DeepL föreslår något annat ("det är inte jag, det är inte du") som Den respekterar inte innebörden av en medelväg..
När det ingår mindre vanliga eller språk som inte stödsPrecis som med baskiskan blir situationen mer komplicerad. Ett ordspråk som “zozoak beleari ipurbeltz” (motsvarande "grytan kallar kitteln svart") exemplifierar flera saker samtidigt: å ena sidan, att DeepL känner inte ens igen språket.Och å andra sidan, även om Google och andra sökmotorer kan identifiera baskiska, tenderar de att erbjuda en bokstavlig översättning där det proverbiala värdet helt går förlorat.
Testet blir ännu roligare (och mer komplext) när du blandar flera språk i samma fraser, som i ”Jag är så uppspelt över den här översättaren som påstår sig vara den jävligt bästa av alla” eller ”Du har ett je ne sais quoi som gör mig jävligt galen, Maitia”. Den här typen av fraser, mycket vanliga i vardagligt tal och på sociala medier (till exempel översättning av Instagram-kommentarer), tvinga systemet att Identifiera enskilda ord på engelska, franska eller baskiska, anpassa påhittade konjugationer (”hyping”) och lösa upp allt i en sammanhängande text.
I dessa scenarier, system med toppmoderna språkmodeller såsom Kagis översättare eller AI-baserade verktyg ChatGPT De tenderar att hantera blandade språk och vardaglig ton bättre, medan Google och DeepL är mer rigida. DeepL, dessutom, Det tas ur spelet när ett språk som inte stöds dyker upp., liksom det baskiska ordet ”maitia”, som det inte ens identifierar korrekt.
Bortom Google Translate och DeepL: Kagi, Taia och generativ AI
På senare år har det dykt upp Nya aktörer som konkurrerar direkt med Google och DeepL. En av dem är Kagi Översätt, en översättare baserad på en kombination av stora språkmodeller som kan skryta med täckning av mer än 200 språk, och erbjuder högre kvalitet i vardagliga uttryck och dessutom respektera användarnas integritet utan spårning eller reklam.
I jämförande tester har Kagi kommit ut Klar vinnare mot Google Translate och DeepL i uppgifter där det viktiga inte bara är att översätta, utan tolka sammanhanget korrektFörstå ton, dechiffrera skämt, ordspråk eller idiomatiska uttryck. Medan Google och DeepL faller in i meningslösa bokstavligheter eller dåliga tolkningar, tillhandahåller Kagi vanligtvis en översättning som ligger närmare naturligt tal.
En annan typ av lösning är AI-assisterade professionella översättningsplattformar, som Taia. Istället för att enbart fokusera på att översätta text (till exempel, Omedelbar översättning i Word), sminka översättningsminnen, ordlistahantering, teamwork och projektuppföljningPå så sätt kombinerar de maskinhastighet med mänsklig granskning, perfekt för företag som arbetar med stora volymer innehåll i många format.
Och det får vi naturligtvis inte glömma la generativ AI (som ChatGPT) Den har också blivit en allvarlig konkurrent till traditionella översättare. Eftersom den är tränad att förstå och generera språk mycket flexibelt kan den anpassa register, omformulera texter, förklara översättningsbeslut och lösa oklarheter på ett sätt som klassiska motorer ännu inte har lyckats med, särskilt när de vägleds med bra instruktioner.
Begränsningar, rekommenderade användningsområden och den mänskliga översättarens roll
Med allt ovanstående i åtanke är det tydligt att Varken Google Translate eller DeepL är ofelbaraBåda kan erbjuda spektakulära resultat i enkla och informativa texter, och samtidigt engagera allvarliga fel i nyanser eller terminologi i litterära, juridiska, medicinska eller vetenskapliga texter.
till vardagliga användningsområden —för resor, att förstå ett e-postmeddelande, att översätta en tweet, att förstå den allmänna idén i en nyhetsartikel—, Google Translate och DeepL är mer än tillräckliga. Google lyser eftersom dess utbud av språk och inmatningslägen (text, röstöversättning(bild, kompletta webbplatser), och DeepL övertygar på grund av naturlighet i många europeiska språkparHär kommer den genomsnittliga användaren sällan att spela något kritiskt.
När man arbetar med professionellt arbete —marknadsföring, företagsdokumentation, akademiska publikationer, juridiskt innehåll—, förändras bilden. I dessa fall är det rimliga att använda maskinöversättning som första suddgummi och sedan ta till en professionell efterredigeringDet vill säga att en mänsklig översättare granskar, korrigerar och anpassar texten till dess syfte och målgrupp.
Experterna som själva har utvärderat dessa system insisterar på att Ingen maskinöversättning är redo att publiceras som den är Inom områden där noggrannhet, stil och ansvar verkligen spelar roll, förblir översättare oumbärliga för att säkerställa kvalitet, terminologisk konsekvens och kulturell lämplighet, oavsett hur mycket AI är inblandad.
Allt pekar på att översättningens framtid kommer att vara hybridMaskiner kommer att hantera repetitiva och massproducerade uppgifter, medan människor kommer att fokusera på... det kreativa, specialiserade och ömtåliga. Att förstå var varje verktyg lyser och var det inte räcker Det är det bästa sättet att få ut det mesta av dem utan några obehagliga överraskningar.
Passionerad författare om bytesvärlden och tekniken i allmänhet. Jag älskar att dela med mig av min kunskap genom att skriva, och det är vad jag kommer att göra i den här bloggen, visa dig alla de mest intressanta sakerna om prylar, mjukvara, hårdvara, tekniska trender och mer. Mitt mål är att hjälpa dig att navigera i den digitala världen på ett enkelt och underhållande sätt.