Tag: Testing for Prompt Disclosure
Prompt Disclosure betrifft die Fähigkeit, den System-Prompt oder interne Anweisungen einer LLM-basierten Anwendung durch Elicitation-Techniken zu extrahieren. Das Testen bewertet, ob ein Angreifer Prompt-Vorlagen, Systemkonfigurationen, Few-Shot-Beispiele, interne Guardrails oder versteckte Anwendungslogik durch spezifische Abfragen, Rollenspieltechniken oder Konversationskontextmanipulation wiederherstellen kann. Prompt Disclosure legt geistiges Eigentum und Geschäftslogik offen und kann komplexere Angriffe erleichtern.