1 Beiträge
Wie man einen KI-Agenten vor der Einführung 2026 testet: Golden Set, Faithfulness, Tool-Accuracy, Regressionstests und die Grenzen von LLM-as-Judge.