Schlagwort: Anthropische
Anthropische Forscher zermürben die KI-Ethik mit wiederholten Fragen
Wie bringt man eine KI dazu, eine Frage zu beantworten, die sie nicht beantworten sollte? Es gibt viele solcher „Jailbreak“-Techniken, und Anthropic-Forscher haben gerade eine neue entdeckt, mit der ein…
Anthropische Forscher finden heraus, dass KI-Modelle darauf trainiert werden können, zu täuschen
Die meisten Menschen erlernen die Fähigkeit, andere Menschen zu täuschen. Können KI-Modelle also dasselbe lernen? Ja, die Antwort scheint – und erschreckenderweise sind sie außergewöhnlich gut darin. Ein kürzlich Studie…