Anthropic stellt ehemaligen Sicherheitsleiter von OpenAI als Leiter des neuen Teams ein

Jan Leike, ein führender KI-Forscher, der Anfang des Monats bei OpenAI zurückgetreten war, bevor er den Ansatz des Unternehmens zur KI-Sicherheit öffentlich kritisierte, ist dem OpenAI-Konkurrenten Anthropic beigetreten, um ein neues „Superalignment“-Team zu leiten.

In einem Beitrag auf X sagte Leike, dass sich sein Team bei Anthropic auf verschiedene Aspekte der Sicherheit von KI konzentrieren werde, insbesondere auf „skalierbare Überwachung“, „Generalisierung von schwacher zu starker“ und die Erforschung der automatischen Ausrichtung.

Ich freue mich, dabei zu sein @AnthropicAI um die Superausrichtungsmission fortzusetzen!

Mein neues Team wird an skalierbarer Überwachung, Generalisierung von schwachen zu starken Veränderungen und automatisierter Ausrichtungsforschung arbeiten.

Wenn Sie Interesse haben, mitzumachen, sind meine DMs offen.

— Jan Leike (@janleike) 28. Mai 2024

Eine mit der Angelegenheit vertraute Quelle teilte Tech mit, dass Leike direkt an Jared Kaplan, den wissenschaftlichen Leiter von Anthropic, berichten werde und dass die Forscher von Anthropic, die derzeit an skalierbarer Aufsicht arbeiten – Techniken, um das Verhalten großer künstlicher Intelligenz auf vorhersehbare und wünschenswerte Weise zu steuern –, zu Leike wechseln werden, wenn Leikes Team hochfährt.

✨🪩 Juhuu! 🪩✨

Jan hat einige grundlegende Arbeiten zur technischen KI-Sicherheit geleitet und ich freue mich sehr, mit ihm zusammenzuarbeiten! Wir werden Zwillingsteams leiten, die sich mit unterschiedlichen Aspekten des Problems der Anpassung von KI-Systemen an die menschliche Ebene und darüber hinaus befassen. https://t.co/aqSFTnOEG0

— Sam Bowman (@sleepinyourhat) 28. Mai 2024

In vielerlei Hinsicht ähnelt die Mission von Leikes Team der des kürzlich aufgelösten Superalignment-Teams von OpenAI. Das Superalignment-Team, das Leike mitleitete, hatte das ehrgeizige Ziel, die zentralen technischen Herausforderungen der Steuerung superintelligenter KI in den nächsten vier Jahren zu lösen, wurde dabei jedoch oft durch die Führung von OpenAI behindert.

Anthropic hat oft versucht, sich als sicherheitsorientierter zu positionieren als OpenAI.

Der CEO von Anthropic, Dario Amodei, war einst Vizepräsident für Forschung bei OpenAI und trennte sich Berichten zufolge von OpenAI, nachdem es zu Meinungsverschiedenheiten über die Ausrichtung des Unternehmens gekommen war – nämlich über den wachsenden kommerziellen Fokus von OpenAI. Amodei brachte eine Reihe ehemaliger OpenAI-Mitarbeiter mit, um Anthropic zu gründen, darunter auch den ehemaligen Leiter für Politik bei OpenAI, Jack Clark.

tch-1-tech

Trump beendet den Rechtsstreit um Twitterverbot

Trump bietet eine Neuansiedlung zu weißen Südafrikanern – World

Trump Administration unterstützt große Waffenverkäufe an Israel – World

Apples neuer Forschungsroboter nimmt eine Seite aus Pixars Playbook

Anthropic stellt ehemaligen Sicherheitsleiter von OpenAI als Leiter des neuen Teams ein