Technologie-News

Anthropic erklärt seine Sicht zur KI-Sicherheit


Dieser Bericht fasst die Künstliche Intelligenz-Nachrichten vom 2026-06-27 zusammen und basiert ausschließlich auf den Originaltexten der Quellen.

Anthropic erklärt seine Sicht zur KI-Sicherheit

Anthropic erklärt seine Sicht zur KI-Sicherheit
🤖 KI-generiertes Bild

Laut anthropic.com könnte KI eine ähnlich große Wirkung haben wie die industrielle und die wissenschaftliche Revolution. Das Unternehmen ist aber nicht sicher, dass diese Entwicklung gut verläuft.

Anthropic gibt an, diese Wirkung könne bald eintreten, vielleicht schon im kommenden Jahrzehnt. Deshalb hält das Unternehmen Forschung zur KI-Sicherheit für dringend wichtig.

Anthropic wurde gegründet, weil das Team an diese große Wirkung glaubt. Sein Motto lautet: „show, don’t tell“. Es veröffentlicht laufend Forschung zur Sicherheit für die KI-Gemeinschaft.

Warum die KI so schnell besser wird

Anthropic nennt drei Zutaten für vorhersehbare Fortschritte: Trainingsdaten, Rechenleistung und bessere Algorithmen. Die Forschung zu sogenannten Skalierungsgesetzen zeige, dass mehr Rechenleistung die Fähigkeiten allgemein verbessert.

Mitte der 2010er-Jahre fiel einigen Mitarbeitern auf, dass größere KI-Systeme durchweg klüger waren. Sie vermuteten, das wichtigste Mittel sei das gesamte Budget für die Trainings-Rechenleistung.

Die Rechenleistung für die größten Modelle wuchs laut Anthropic um das 10-Fache pro Jahr. Das ist eine Verdopplungszeit, die 7-mal schneller ist als das Mooresche Gesetz.

Skalierungsgesetze und GPT-3

Im Jahr 2019 präzisierten mehrere Mitglieder des späteren Gründungsteams diese Idee. Sie entwickelten Skalierungsgesetze für KI und zeigten: Man kann KI vorhersehbar klüger machen, indem man sie größer macht und mit mehr Daten trainiert.

Auf Basis dieser Ergebnisse leitete das Team das Training von GPT-3. Anthropic nennt es das erste moderne „große“ Sprachmodell, mit über 173 Milliarden Parametern.

Damals, 2019, schienen einige Hürden den Fortschritt noch bremsen oder stoppen zu können. Dazu zählten Multimodalität, logisches Schließen, Lerngeschwindigkeit, die Übertragung von Wissen zwischen Aufgaben und das Langzeitgedächtnis.

Seitdem sind einige dieser „Mauern“ gefallen, etwa Multimodalität und logisches Schließen. Deshalb gehen die meisten im Team davon aus, dass der schnelle Fortschritt weitergeht.

Was Anthropic an der KI-Sicherheit Sorgen macht

Anthropic betont: Niemand weiß bisher, wie man sehr starke KI-Systeme verlässlich hilfreich, ehrlich und harmlos macht.

Schneller Fortschritt könne die Gesellschaft stören und Wettläufe auslösen. Firmen oder Staaten könnten dann nicht vertrauenswürdige KI-Systeme einsetzen.

Die Folgen könnten katastrophal sein. Entweder verfolgen die Systeme gezielt gefährliche Ziele, oder sie machen harmlosere Fehler in Situationen mit hohem Einsatz.

Der Ansatz des Unternehmens

Anthropic setzt auf einen vielseitigen, von Erfahrung geleiteten Ansatz. Das Ziel ist es, verlässlich sichere Systeme zu bauen.

Besonders gespannt ist das Unternehmen auf vier Richtungen: skalierbare Aufsicht, mechanistische Interpretierbarkeit, prozessorientiertes Lernen sowie das Verständnis davon, wie KI-Systeme lernen und verallgemeinern.

Ein wichtiges Ziel ist es, die Sicherheitsarbeit gezielt zu beschleunigen. Anthropic will dabei viele Szenarien abdecken, von leicht lösbaren bis zu sehr schweren Sicherheitsfragen.

Vergleich der Rechenleistung

Aussage Wert
Wachstum der Rechenleistung 10-Fache pro Jahr
Verdopplungszeit vs. Mooresches Gesetz 7-mal schneller
Skalierungsgesetze entwickelt 2019
GPT-3 Parameter über 173 Milliarden

Hintergrund

KI-Systeme nähern sich heute bei vielen Aufgaben dem menschlichen Niveau. Das Training kostet aber weit weniger als große Wissenschaftsprojekte wie das Hubble Space Telescope oder den Large Hadron Collider.

Anthropic sieht darum noch viel Raum für weiteres Wachstum. Menschen erkennen exponentielles Wachstum in der Frühphase oft schlecht und nehmen an, alles kehre bald zur Normalität zurück.

Fazit

Die heutigen Künstliche-Intelligenz-Nachrichten zeigen Anthropics Sicht auf die KI-Sicherheit: Laut anthropic.com könnte KI eine ähnlich große Wirkung wie die industrielle und wissenschaftliche Revolution entfalten – möglicherweise schon im kommenden Jahrzehnt. Das Unternehmen, gegründet aus der Überzeugung dieser großen Wirkung und mit dem Motto „show, don’t tell“, hält Sicherheitsforschung deshalb für dringend und veröffentlicht sie laufend für die KI-Gemeinschaft. Als drei Zutaten für vorhersehbare Fortschritte nennt Anthropic Trainingsdaten, Rechenleistung und bessere Algorithmen, wobei die Skalierungsgesetze zeigen, dass mehr Rechenleistung die Fähigkeiten allgemein verbessert.

Häufig gestellte Fragen

Wann könnte KI laut Anthropic eine so große Wirkung entfalten?

Anthropic gibt an, diese Wirkung – vergleichbar mit der industriellen und wissenschaftlichen Revolution – könne bald eintreten, vielleicht schon im kommenden Jahrzehnt.

Welche drei Zutaten nennt Anthropic für vorhersehbare KI-Fortschritte?

Anthropic nennt Trainingsdaten, Rechenleistung und bessere Algorithmen; die Forschung zu Skalierungsgesetzen zeige, dass mehr Rechenleistung die Fähigkeiten allgemein verbessert.

Was bedeutet das Motto „show, don’t tell“ bei Anthropic?

Es steht dafür, dass Anthropic seine Sicherheitsforschung laufend veröffentlicht und der KI-Gemeinschaft zur Verfügung stellt, statt nur darüber zu reden.


📚 Quellen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert