Spam-Erkennung: Gmail erhält eines seiner größten Sicherheitsupdates

Spam Erkennung Gmail erhaelt eines seiner groessten Sicherheitsupdates
Google hat die Details zu einer aktualisierten Technik mitgeteilt, die zur Verbesserung eingesetzt wird Spam-Erkennung über seinen kostenlosen E-Mail-Dienst Gmail. Spätestens Google-Sicherheit In seinem Blogbeitrag stellt der Technologieriese fest, dass dies „eines der größten Verteidigungs-Upgrades“ sei, die es je gegeben habe Google Mail in den letzten Jahren erhalten hat. Das Unternehmen gibt an, dass sein neuestes Modell eine bessere Texterkennung ermöglicht und die Spam-Erkennung um 38 % verbessert hat.
Wie Spammer Google früher umgangen haben
Um schädliche Inhalte wie Phishing-Angriffe, unangemessene Kommentare und Betrug zu identifizieren, nutzen Systeme wie Gmail, YouTube und Google Playverlassen sich auf Textklassifizierungsmodelle, stellt das Unternehmen fest. Diese Texttypen sind für maschinelle Lernmodelle schwieriger zu klassifizieren, da Spammer aggressive Textmanipulationen verwenden, um diese Klassifikatoren zu umgehen. Angreifer verwendeten beispielsweise Homoglyphen, unsichtbare Zeichen und Keyword-Stuffing, um die Abwehrmaßnahmen von Google zu umgehen.
Was ist RETVec?
Um diese Textklassifizierer strenger und effizienter zu machen, hat Google einen neuen, mehrsprachigen Textvektorisierer namens RETVec (Resilient & Efficient Text Vectoriser) entwickelt. Dies trägt dazu bei, dass die Spam-Filtermodelle eine genauere Klassifizierungsleistung bieten und den Rechenaufwand erheblich senken. Das Unternehmen hat außerdem mitgeteilt, wie es RETVec zum Schutz von Gmail-Posteingängen einsetzt.
Wie RETVec die Spam-Filter von Gmail verbessert
Im vergangenen Jahr hat Google RETVec ausgiebig genutzt, um seine Bedeutung zu bewerten, und festgestellt, dass es sich für Sicherheits- und Missbrauchsbekämpfungsanwendungen als äußerst effektiv erweist. Das Unternehmen ersetzte den bisherigen Textvektorisierer von Gmail durch RETVec, was die Spam-Erkennungsrate des Dienstes um 38 % verbesserte und die Falsch-Positiv-Rate um 19,4 % reduzierte.

Darüber hinaus reduzierte der Einsatz von RETVec den Stromverbrauch des Modells um 83 %. Es funktioniert in jeder Sprache und „und allen UTF-8-Zeichen“ und erfordert keine Textvorverarbeitung. Dies macht es ideal für den Einsatz auf dem Gerät, im Internet und für groß angelegte Textklassifizierungsanwendungen.
Google behauptet, „mit RETVec trainierte Modelle weisen aufgrund ihrer kompakten Darstellung eine schnellere Inferenzgeschwindigkeit auf.“ Das Unternehmen fügt außerdem hinzu, dass „kleinere Modelle die Rechenkosten senken und die Latenz verringern, was für große Anwendungen und On-Device-Modelle von entscheidender Bedeutung ist.“ Diese mit RETVec trainierten Modelle können konvertiert werden TFLite für Mobil- und Edge-Geräte. Das Open-Source-Modell ist auf Github verfügbar.

toi-tech