Skip to content

OpenAi: neues Sicherheitskonzept

Risikobewertung in vier Kategorien.
Jernej Furman from Slovenia, CC BY 2.0, via Wikimedia Commons

Der ChatGPT-Hersteller OpenAI hat ein Sicherheitskonzept für seine KI-Modelle vorgelegt. Im Fokus stehen dabei vier Kategorien, von welchen mögliches Risiko ausgehen könnte: Cybersicherheit; atomare, chemische, biologische oder radiologische Bedrohung; Überzeugungskraft sowie die Autonomie des Modells.

Jeder Kategorie wird nach gewissen Kriterien eine von vier Risikostufen von „niedrig“ bis zu „kritisch“ zugeordnet. Die Einstufung soll nach der Umsetzung von Sicherheitsmaßnahmen – „mitigations“ – erfolgen. Zusätzlich zu den Kategorien wird auch das Gesamtmodell bewertet. Dafür wird der höchste Einzelwert einer Kategorie genommen. Sollte demnach beispielsweise die Kategorie Cybersicherheit mit der Stufe „kritisch“ bewertet werden, würde diese Bewertung für das gesamte Modell zutreffen. OpenAI zufolge sollen nur solche KI-Modelle eingesetzt werden dürfen, deren Risiko nach dem Einbau der Sicherheitsmaßnahmen höchstens die zweihöchste Stufe “mittel” erreicht. Die Weiterentwicklung von Modellen, welche als „kritisch“ eingestuft worden sind, soll zukünftig komplett untersagt werden. 

Teil des Sicherheitskonzepts sind verschiedene Gruppen zur Überwachung und Beratung. Das Board soll dabei Entscheidungen der Konzernführung kippen dürfen.

OpenAI hatte vor gut einem Jahr mit seiner KI-Chatbot-Software ChatGPT das Interesse der Öffentlichkeit auf die jüngsten Durchbrüche bei der generativen KI gelenkt. Forscher zeigen sich jedoch besorgt über potenzielle Gefahren der Technologie, die auf menschenähnliche Art etwa Texte schreiben, Daten auswerten und Bilder generieren kann. Umfragen zufolge wird diese Sorge in der Bevölkerung geteilt: Einer Reuters/Ipsos-Umfrage vom Mai zufolge glauben 61 Prozent der US-Bürger, dass KI die menschliche Zivilisation bedrohen könnte. 

APA/Red.

Gefällt Ihnen der Beitrag?
Facebook
Twitter
LinkedIn
Telegram
WhatsApp
Email
Cookie-Einwilligung mit Real Cookie Banner