Tag: AI Safety
Disziplin, die Maßnahmen untersucht und implementiert, um sicherzustellen, dass KI-Systeme sicher, zuverlässig und im Einklang mit den beabsichtigten Zielen arbeiten. Deckt Modellausrichtung, Robustheit gegenüber adversen Eingaben, Entscheidungsinterpretierbarkeit, Unsicherheitsmanagement, Fail-Safe-Mechanismen, Verhaltensüberwachung und die Vermeidung schädlicher oder unbeabsichtigter Ausgaben in kritischen Kontexten ab.