Golem pur

Golem.de ohne Werbung nutzen
Mehrseitige Artikel auf einer Seite lesen
RSS-Volltext-Feed für Artikel
Ab 3,00 € pro Monat

Gemini, ChatGPT und LLaVA: Neuer Wurm verbreitet sich in KI-Ökosystemen selbst

Forscher haben einen KI-Wurm entwickelt. Dieser kann nicht nur sensible Daten abgreifen, sondern sich auch selbst in einem GenAI-Ökosystem ausbreiten.

Artikel veröffentlicht am 2. März 2024, 11:33 Uhr, Marc Stöckel

Forscher haben einen Wurm entwickelt, der sich selbst auf KI-Tools ausbreitet. (Bild: JOEL SAGET/AFP via Getty Images)

Sicherheitsforscher haben einen speziellen KI-Wurm namens Morris II entwickelt, der sich automatisch von einem generativen KI-System auf ein anderes ausbreiten und potenziell Daten abgreifen und Spam-E-Mails versenden kann. "Das bedeutet im Grunde, dass man jetzt die Möglichkeit hat, eine neue Art von Cyberangriff durchzuführen, die es bisher noch nicht gegeben hat", erklärte Ben Nassi, einer der Forscher dieses Projekts, gegenüber Wired.

Angeblich handelt es sich um den ersten generativen KI-Wurm, der darauf abzielt, GenAI-Ökosysteme durch die Verwendung von sich selbst replizierenden Anweisungen zu attackieren.

Gemini, ChatGPT und LLaVA auf dem Prüfstand

Die Forscher haben ihren Wurm nach eigenen Angaben unter Einsatz verschiedener Einstellungen und Eingabedaten innerhalb einer Testumgebung gegen KI-basierte E-Mail-Assistenten getestet. Dabei nahmen die Sicherheitsforscher drei verschiedene KI-Modelle ins Visier: Googles Gemini Pro, OpenAIs ChatGPT 4.0 und das quelloffene und auf Metas LLaMA basierende Modell LLaVA (Large Language Visual Assistant).

KI-Modelle generieren selber neue Anweisungen

Dem Wired-Bericht zufolge konnten die Forscher Daten aus E-Mails extrahieren: Möglich sei etwa das Abgreifen von Namen, Rufnummern, Kreditkartennummern oder anderen sensiblen Informationen. Ein ausführliches Paper zu Morris II sowie ein kurzes Demonstrationsvideo haben die Forscher auf einer Webseite veröffentlicht.

"Die Studie zeigt, dass Angreifer Anweisungen in die Eingabefelder einfügen können, die, wenn sie von einem GenAI-Modell verarbeitet werden, dieses dazu veranlassen, die Eingabe als Ausgabe zu replizieren und bösartige Aktivitäten auszuführen", erklären die Sicherheitsforscher. Ferner werde der angegriffene KI-Agent dazu veranlasst, die bösartigen Eingaben durch Verbindungen innerhalb des GenAI-Ökosystems an andere Agenten weiterzugeben.

Die Vorgehensweise wird mit jener von klassischen SQL-Injection- und Pufferüberlauf-Angriffen verglichen. Zum Einsatz komme ein "bösartiger selbstreplizierender Prompt", der das KI-Modell dazu veranlasse, in seiner Antwort anstelle von Daten selber Anweisungen auszugeben, so die Forscher.

Google und OpenAI sind informiert

Die Verantwortung sehen die Sicherheitsforscher allerdings nicht bei Google oder OpenAI. "Der Wurm nutzt ein schlechtes Architekturdesign für das GenAI-Ökosystem aus und ist keine Schwachstelle im GenAI-Service", heißt es auf der Webseite des Projekts. Die Erkenntnisse zu Morris II seien aber dennoch an die beiden Softwarekonzerne übermittelt worden. In den kommenden zwei bis drei Jahren rechnen die Forscher auch in freier Wildbahn mit generativen KI-Würmern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de

ohne Werbung
mit ausgeschaltetem Javascript
mit RSS-Volltext-Feed

Themenseiten:

Kommentarübersicht

Re: schlechtes Architekturdesign

Dr.Ne0Gen3tic 03. Mär 2024

Ich verstehe das so Im Text steht das die KI also das LLM statt Antworten Anweisungen...

Re: Super

Christian-Hofmann 03. Mär 2024

Das Prinzip sollte man auf Menschen auch übertragen. Erst wenn dieser einen Nachweis...

Artikel

Elektromagnetische Leckstrahlung

Starlink-Satelliten der zweiten Generation stören noch mehr

Die neuen Starlink-Satelliten emittieren starke elektromagnetische Leckstrahlung. Astronomen fordern Gegenmaßnahmen.
Arbeitsplatzabbau

Gerüchte über 30.000 Entlassungen bei VW

Volkswagen will sich in Deutschland angeblich von einer großen Zahl von Mitarbeitern trennen und Investitionen sollen gekürzt werden.
KI

Apple Intelligence kommt doch nach Deutschland

Apple hat seine Pläne für die Einführung der KI-Funktionen geändert. Nun ist Deutschland doch auf der Liste.

Schnäppchen, Rabatte und Top-Angebote

Die besten Deals des Tages

Daily Deals • Palit RTX 4070 zum Tiefstpreis • EA FC 25 günstig wie nie • Vorbestellbar: iPhone 16, Apple Watch 10 & AirPods 4 • Samsung 990 PRO 2 TB 164€ [Werbung]

Themen
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
#