Open-Source-Tool von CyberArk schützt vor KI-Jailbreaks

Düsseldorf, 13. Dezember 2024 – CyberArk, das führende Unternehmen für Identity Security, hat mit FuzzyAI ein innovatives quelloffenes Framework vorgestellt, das bislang für jedes getestete KI-Modell einen Jailbreak gefunden hat. Es hilft Unternehmen, Schwachstellen in ihren KI-Modellen zu identifizieren und zu beheben, etwa das Umgehen von Guardrails oder die Generierung von schädlichen Inhalten. FuzzyAI lässt sich auf alle KI-Modelle anwenden, die in der Cloud und intern gehostet werden. Auf der Black Hat Europe 2024 hat CyberArk die Fähigkeiten des Tools demonstriert.  KI-Modelle sind die Basis für innovative Anwendungen zur Interaktion mit Kunden sowie zur Verbesserung und Automatisierung interner Prozesse. Sie transformieren die Wirtschaft, doch der Einsatz der Modelle geht mit neuen Herausforderungen im Sicherheitsbereich einher, auf die die meisten Unternehmen nicht vorbereitet sind. FuzzyAI hilft ihnen, diese Herausforderungen zu bewältigen, indem es einen systematischen Ansatz für das Testen von KI-Modellen gegen verschiedene gefährliche Eingaben liefert. Auf diese Weise deckt es potenzielle Schwächen in den Sicherheitssystemen des Modells auf und macht die Entwicklung und die Bereitstellung von KI sicherer. Herzstück von FuzzyAI ist ein sogenannter Fuzzer – ein Tool, das Software-Defekte und Software-Schwachstellen aufspürt. Es versteht sich auf mehr als zehn verschiedene Angriffstechniken, vom Umgehen ethischer Filter bis hin zur Aufdeckung versteckter System-Prompts. Die wichtigsten Funktionen von FuzzyAI sind: Umfassendes Fuzzing: FuzzyAI testet KI-Modelle mit verschiedenen Angriffstechniken, um Schwachstellen zu entdecken, etwa das Umgehen von Guardrails, Informationslecks, Prompt Injections oder die Generierung schädlicher Inhalte. Erweiterungsmöglichkeiten: Unternehmen und Forscher können das Framework um eigene Angriffsmethoden erweitern, um die Tests auf domänenspezifische Schwachstellen zuzuschneiden. Zusammenarbeit in der Community: Eine wachsende Community sorgt für eine kontinuierliche Weiterentwicklung von Angriffstechniken und Abwehrmechanismen. „Der Start von FuzzyAI unterstreicht das Engagement von CyberArk für KI-Sicherheit und bringt Unternehmen einen großen Schritt weiter beim Beheben von Sicherheitsproblemen, die mit der zunehmenden Nutzung von KI-Modellen einhergehen“, betont Peretz Regev, Chief Product Officer bei CyberArk. „FuzzyAI wurde in den CyberArk Labs entwickelt und hat seine Fähigkeit, einen Jailbreak in jedem getesteten Modell zu finden, bereits unter Beweis gestellt. Damit versetzt es Unternehmen und Forscher in die Lage, Schwachstellen zu identifizieren und KI-Systeme aktiv gegen neue Bedrohungen zu stärken.“