Schlagwort: KISandbagSicherheitsüberprüfungen
Können KI-Sandbag-Sicherheitsüberprüfungen Benutzer sabotieren? Ja, aber nicht sehr gut – vorerst
KI-Unternehmen geben an, über strenge Sicherheitskontrollen zu verfügen, die sicherstellen, dass Modelle keine seltsamen, illegalen oder unsicheren Dinge sagen oder tun. Aber was wäre, wenn die Modelle in der Lage…