Thema
#Qualität
Beiträge zu diesem Thema – branchenübergreifend.
Praxis Modell-Drift überwachen: warum dein Modell still schlechter wird — und du es zuletzt merkst Warum ein Modell ohne Fehlermeldung schlechter wird — was du überwachst, wenn echte Labels hinterherhinken, und warum menschliche Korrekturen früh warnen. Praxis Prompts wie Code testen: damit eine Änderung nicht heimlich alles verschlechtert Warum du Prompts wie Code testest, nicht auf Textgleichheit, sondern auf Eigenschaften — damit ein Tweak oder Modellwechsel nicht heimlich anderes bricht. Praxis Agenten, die Agenten prüfen: warum ein zweiter Blick die Qualität hebt Warum ein Modell Arbeit besser prüft als fehlerfrei produziert — wie eine Prüfer-Schleife die Qualität hebt und warum sie den Menschen am Ende nicht ersetzt. Praxis Woher du weißt, dass dein RAG nicht lügt: ein Archiv messbar machen Wie du misst, ob dein RAG die richtigen Quellen findet und treu daraus antwortet, statt zu hoffen — der Prüfsatz, die Metriken und warum der Richter selbst geprüft gehört.