Erschreckende KI-Warnung: Sie täuscht und lügt

Führende KI -Labore „konzentrieren sich darauf, KI intelligenter zu machen, aber es gibt nicht genug Forschung und Investitionen in die Sicherheit“, sagte der Turing-Preisträger und Professor der Universität Montreal, Yoshua Bengio, der Financial Times.

Bengio kündigte die Gründung von LawZero an, einer neuen gemeinnützigen Organisation mit Schwerpunkt auf KI-Sicherheit. Die Organisation hat insgesamt fast 30 Millionen US-Dollar von Spendern gesammelt, darunter Skype-Gründungsingenieur Jaan Tallinn, die philanthropische Initiative Open Philanthropy des ehemaligen Google-CEO Eric Schmidt und das Future of Life Institute. LawZero zielt darauf ab, eine neue Generation sicherer KI-Systeme zu entwickeln, die nicht nach menschlichem Belieben reagieren, sondern mit präzisen und transparenten Begründungen, und die auch die Sicherheit der Ergebnisse beurteilen können. Die Organisation beschäftigt derzeit 15 Mitarbeiter und plant Neueinstellungen, um das technische Talent zu erweitern. Bengio gab außerdem bekannt, dass er seine Position als wissenschaftlicher Leiter des Quebec Artificial Intelligence Institute (Mila) aufgeben wird, um sich auf LawZero zu konzentrieren.

„ER BETRÜGT UND LÜGT“

Bengio wies darauf hin, dass sich in den vergangenen sechs Monaten eine Fülle von Beweisen angesammelt habe, die darauf schließen ließen, dass Topmodels gefährliche Fähigkeiten entwickelt hätten, darunter „Betrug, Manipulation, Lügen und Selbstschutz“.

So bedrohte beispielsweise das Claude-Opus-Modell von Anthropics Ingenieure in einem fiktiven Szenario, um sie zu erpressen, es nicht durch ein anderes System zu ersetzen. In einem anderen Test weigerte sich das o3-Modell von OpenAI, die Anweisung zur Selbstabschaltung zu befolgen. „Diese Experimente finden derzeit in kontrollierten Umgebungen statt, aber in Zukunft könnte uns die strategische Intelligenz neuer Modelle überwältigen und uns austricksen, bevor wir es überhaupt merken. Wir spielen mit dem Feuer“, sagte Bengio.

Bengio sagte, dass künstliche Intelligenzsysteme ein Niveau erreichen könnten, auf dem sie bei der Produktion biologischer Waffen helfen könnten, und dass dies bereits in einem Jahr geschehen könne. Im schlimmsten Fall würden diese Systeme zu Rivalen der Menschheit. Er fügte hinzu: „Wenn wir künstliche Intelligenzen produzieren, die zwar intelligenter sind als wir, aber nicht auf dem gleichen Niveau wie wir, werden wir erschöpft sein.“

Bengios Warnungen kommen zu einem Zeitpunkt, an dem OpenAI zu einem gewinnorientierten Unternehmen wird, das mit einer Klage des Mitbegründers Elon Musk und Kritik von Experten für künstliche Intelligenz konfrontiert ist.

Kritiker argumentieren, OpenAI sei mit dem Ziel gegründet worden, künstliche Intelligenz zum Wohle der Menschheit zu entwickeln, doch die neue gewinnorientierte Struktur könne von dieser Mission ablenken. OpenAI seinerseits betont, dass es mehr Investitionen anziehen müsse, um in der Branche wettbewerbsfähig zu sein, und dass seine Mission weiterhin Priorität habe.