Mozilla bringt kostenlose Offline-Übersetzung zu Firefox – Tech

Mozilla bringt kostenlose Offline Uebersetzung zu Firefox – Tech

Mozilla hat Firefox ein offizielles Übersetzungstool hinzugefügt, das sich nicht auf die Cloud-Verarbeitung verlässt, um seine Arbeit zu erledigen, sondern den auf maschinellem Lernen basierenden Prozess direkt auf Ihrem eigenen Computer ausführt. Es ist ein großer Schritt nach vorne für einen beliebten Dienst, der stark an Giganten wie Google und Microsoft gebunden ist.

Das Übersetzungstool namens Firefox-Übersetzungen, kann hier zu Ihrem Browser hinzugefügt werden. Es muss einige Ressourcen herunterladen, wenn es das erste Mal eine Sprache übersetzt, und vermutlich kann es bei Bedarf verbesserte Modelle herunterladen, aber die eigentliche Übersetzungsarbeit wird von Ihrem Computer erledigt, nicht in einem Rechenzentrum, das ein paar hundert Kilometer entfernt ist.

Dies ist nicht wichtig, weil viele Leute in ihren Browsern offline übersetzen müssen – wie eine Fliegengittertür für ein U-Boot, es ist kein wirklich sinnvoller Anwendungsfall – sondern weil das Ziel darin besteht, die Abhängigkeit von Cloud-Anbietern mit Hintergedanken zu verringern eine Aufgabe, die ihre Ressourcen nicht mehr erfordert.

Es ist das Ergebnis des EU-finanzierten Projekts Bergamotte, bei dem Mozilla mit mehreren Universitäten an einer Reihe von Tools für maschinelles Lernen zusammenarbeitete, die Offline-Übersetzungen ermöglichen würden. Normalerweise wird diese Art von Arbeit von GPU-Clustern in Rechenzentren erledigt, wo große Sprachmodelle (Gigabyte groß und mit Milliarden von Parametern) bereitgestellt werden, um die Abfrage eines Benutzers zu übersetzen.

Aber während die Cloud-basierten Tools von Google und Microsoft (ganz zu schweigen von DeepL und anderen aufstrebenden Konkurrenten) genau und (aufgrund ihrer nahezu unbegrenzten Rechenleistung) schnell sind, besteht ein grundlegendes Datenschutz- und Sicherheitsrisiko beim Senden Ihrer Daten an Dritte Partei analysiert und zurückgesendet werden. Für einige ist dieses Risiko akzeptabel, während andere es vorziehen, Internet-Werbegiganten nicht einzubeziehen, wenn sie nicht müssen.

Wenn ich die Speisekarte des Tapas-Lokals mit Google übersetze, werde ich dann für Wurstwerbung angegriffen? Noch wichtiger ist, wenn jemand Einwanderungs- oder medizinische Papiere mit bekannter Geräte-ID und Standort übersetzt, wird ICE anklopfen? Alles offline zu erledigen, ist für jeden sinnvoll, der sich Sorgen über die Auswirkungen auf die Privatsphäre macht, wenn er einen Cloud-Anbieter für Übersetzungen nutzt, egal in welcher Situation.

Die Übersetzungsqualität habe ich schnell getestet und für mehr als ausreichend befunden. Hier ist ein Ausschnitt aus der Titelseite der spanischsprachigen Nachrichtenagentur El País:

Bildnachweis: El País

Ziemlich gut! Natürlich wurde El País im Tab-Titel als „Das Paris“ übersetzt, und es gab viele andere fragwürdige Formulierungen (obwohl es jedes | als „Oh, es ist eine gute Sache“ übersetzt hat – ziemlich urkomisch). Aber nur sehr wenig davon stand dem Verständnis des Kerns im Weg.

Und genau das sollen die meisten maschinellen Übersetzungen tun: die grundlegende Bedeutung wiedergeben. Für jede Art von Nuance oder Subtilität ist selbst ein großes Sprachmodell möglicherweise nicht in der Lage, die Redewendung zu replizieren, daher ist eine tatsächlich zweisprachige Person die beste Wahl.

Die Hauptbeschränkung ist wahrscheinlich ein Mangel an Sprachen. Google Translate unterstützt über hundert – Firefox Translations ein gerades Dutzend: Spanisch, Bulgarisch, Tschechisch, Estnisch, Deutsch, Isländisch, Italienisch, Norwegisch Bokmal und Nynorsk, Persisch, Portugiesisch und Russisch. Das lässt einiges aus, aber denken Sie daran, dass dies nur die erste Veröffentlichung eines Projekts einer gemeinnützigen Organisation und einer Gruppe von Akademikern ist – kein Festzeltprodukt eines milliardenschweren weltumspannenden Internetimperiums.

Tatsächlich bitten die Ersteller aktiv um Hilfe Freilegen einer Trainingspipeline „Enthusiasten“ neue Modelle trainieren zu lassen. Und sie bitten auch um Feedback, um die bestehenden Modelle zu verbessern. Das ist ein brauchbares Produkt, aber noch lange kein fertiges!

tch-1-tech