Dokumente auslesen: Vom Papierstapel zum erfassten Datensatz — geprüft, nicht blind übernommen

Wie KI Belege, Rezepte, Lieferscheine und Formulare ausliest und zur Vorerfassung strukturiert — wo Handschrift und Scans sie kippen und warum ein Mensch jeden Datensatz prüft.

Die meisten fragen: “Kann KI Dokumente scannen?” Die bessere Frage ist: “Wie viele Stunden gehen drauf, weil jemand Belege, Lieferscheine oder Formulare von Hand abtippt — und wie viele Fehler schleichen sich dabei ein?”

Genau das nimmt dieser Anwendungsfall ab: KI liest eingehende Dokumente aus, zieht die relevanten Felder heraus und legt einen strukturierten Vorerfassungs-Vorschlag — den ein Mensch prüft, bevor etwas ins System übernommen wird. Texterkennung (oft als OCR abgekürzt) ist die Grundlage, das Strukturieren der eigentliche Wert. Diese Seite zeigt, was das wirklich kann, wo es kippt, was es kostet und worauf du achtest. Branchenübergreifend, weil das Abtippen überall gleich stumpf und fehleranfällig ist.

abtippen

stumpfe Arbeit, die Personal bindet und genau dabei Fehler produziert

Handschrift

kritzelige Belege sind genau das, was die Erkennung am wenigsten kann

prüfen

jeder Datensatz wird kontrolliert, bevor er übernommen wird

Was es wirklich kann

Es ist derselbe Ablauf — nur die Dokumente sind andere. Aus eingehendem Papier wird ein geprüfter Datensatz:

in der Steuerkanzlei der vorkontierte Beleg statt des Schuhkartons,
in der Klinik das ausgelesene Aufnahmeformular oder der externe Befund,
in der Spedition der erfasste Lieferschein oder Frachtbrief,
im Sanitätshaus die vorerfasste Verordnung,
in der Hausverwaltung die Handwerkerrechnung, Objekt und Kostenart zugeordnet.

Der gemeinsame Nenner: Die KI liest aus, ordnet die Angaben in Felder und markiert, was unsicher oder unleserlich ist. Ein Mensch prüft und übernimmt. Sie nimmt das Abtippen ab, nicht die Entscheidung.

Wichtig ist der Unterschied zum durchsuchbaren Archiv: Dort sucht die KI in Dokumenten nach Antworten. Hier holt sie strukturierte Daten aus einem Dokument heraus — Beträge, Datumsangaben, Positionen, Namen — und bereitet sie für dein System auf.

So entsteht ein geprüfter Datensatz

Dokument hereingeben

Scan, Foto, Fax, PDF

▶

Egal in welcher Form das Dokument kommt — die KI nimmt es auf, so wie es da ist.

Text und Felder auslesen

Texterkennung

▶

Die Texterkennung zieht den Inhalt heraus und ordnet ihn den erwarteten Feldern zu — Datum, Betrag, Absender, Positionen.

Unsicheres markieren

kein stilles Raten

▶

Was schlecht lesbar oder mehrdeutig ist, wird als “[prüfen]” markiert, statt einfach einen plausiblen Wert hinzuschreiben.

Mensch prüft und übernimmt

hier liegt die Verantwortung

▶

Ein Mensch kontrolliert den Vorschlag — besonders Beträge und Mengen — und übernimmt ihn dann ins System. Vorher passiert nichts.

Wo es in der Praxis kippt

Handschrift. Der Klassiker, und ausgerechnet die wichtigsten Dokumente sind oft handschriftlich — Rezepte, handschriftliche Ergänzungen, gestempelte Frachtpapiere. Genau da liest die Erkennung am unzuverlässigsten. Deshalb ist die Prüfung kein Zusatz, sondern Teil des Ablaufs.

Schlechte Foto- und Scanqualität. Schief abfotografiert, dunkel, geknickt, durchscheinend — jede dieser Kleinigkeiten kippt die Erkennung. Ein krummes Handyfoto eines Belegs ist die häufigste Fehlerquelle überhaupt.

Tabellen und krumme Layouts. Bei mehrspaltigen Belegen werden Felder gern vertauscht — Betrag und Datum, Menge und Position. Das fällt nicht auf, wenn niemand gegenliest.

Mehrdeutige Sonderfälle. Eine Rechnung, die auf drei Konten aufzuteilen ist, ein ungewöhnlicher Beleg — hier rät das Modell munter. Die Standardfälle laufen gut, die Ausnahmen gehören geprüft.

„Sieht plausibel aus, ist aber falsch.” Eine falsch ausgelesene Zahl sieht genauso unauffällig aus wie eine richtige. Deshalb wird gerade bei Beträgen und Mengen kontrolliert, nicht durchgewunken.

Haftungsrelevante Dokumente. Belege fürs Finanzamt, Verordnungen, Zoll- und Gefahrgutpapiere — ein Fehler ist hier teuer. Solche Dokumente werden nicht ohne Prüfung übernommen.

Was es kostet — und woran

Der Aufbau ist überschaubar, aber die Genauigkeit hängt stark an Dokumentenqualität und -vielfalt. Der Aufwand am Anfang steckt im Einstellen auf eure konkreten Belegtypen und im Definieren der Felder — grob ein paar Tage bis Wochen, je nachdem, wie einheitlich oder bunt eure Eingänge sind.

Der ehrliche Punkt, den viele überhören: Die Prüfung fällt nicht weg. Sie ist dauerhaft Teil des Ablaufs, nicht ein Anfangszustand, der später verschwindet. Der Gewinn ist, dass jemand einen Vorschlag kontrolliert statt alles abtippt — das ist deutlich schneller, aber nicht null. Wer dir „100 Prozent automatisch, keine Kontrolle” verspricht, beschönigt genau die Stelle, an der es teuer wird.

Wo du die Finger weglässt

Blind buchen oder übernehmen. Ohne Prüfung ins System — das verbietet sich bei allem, was Haftung trägt: Finanzamt, Patientenakte, Zoll. Der Vorschlag ist ein Vorschlag.

Bewerten und entscheiden. Ob ein Beleg abzugsfähig, eine Position umlagefähig, eine Verordnung abrechenbar ist — das beurteilt der Fachmensch. Die KI erfasst, sie bewertet nicht.

Kritische Handschrift ohne Doppelblick. Wo es auf eine handschriftliche Angabe ankommt, schaut ein Mensch hin, statt der Erkennung zu vertrauen.

Die KI liest aus und schlägt vor. Was gebucht, übernommen und verantwortet wird, prüft ein Mensch.

Wie ein ehrlicher Pilot aussieht

Nimm eine Belegart mit gleichartiger Struktur — die, die am häufigsten reinkommt — und lass nur die auslesen und vorerfassen, eine Woche lang. Dann miss zwei Dinge: Geht das Erfassen spürbar schneller als von Hand? Und macht die geprüfte Variante weniger Fehler als das Abtippen? Wenn beides stimmt, hast du den Beweis. Erst dann weitere Belegtypen.

Worauf du achtest, wenn dir das jemand verkauft

Wie geht das System mit Handschrift und schlechten Scans um — und zeigt es seine Unsicherheit, statt still zu raten? Das ist das K.-o.-Kriterium.
Markiert es unsichere Felder zur Prüfung, oder gibt es alles als sicher aus? Letzteres versteckt genau die Fehler, die teuer werden.
Bleibt die Übernahme ins System beim Menschen, oder bucht es autonom?
Wo liegen die Dokumente, gerade die sensiblen (Belege, Patienten, Personal)? Passt das zu deinem Datenschutz?
Lassen sich neue Belegtypen ergänzen, oder ist es auf wenige Formate festgelegt?

Zum Mitnehmen

Wenn der nächste Stapel reinkommt, kopier ein Dokument mit diesem Prompt in ein KI-Werkzeug — du bekommst eine Vorerfassung, die nichts erfindet:

Du liest ein eingehendes Dokument aus und bereitest es als strukturierten Datensatz vor.
Ich gebe dir das Dokument (Bild oder PDF).

1. Ziehe die relevanten Felder heraus (z. B. Datum, Betrag, Absender/Empfänger, Positionen, Nummern)
   und ordne sie klar zu.
2. Markiere jedes Feld, das schlecht lesbar oder mehrdeutig ist, als "[prüfen]" — schreib KEINEN
   geratenen Wert hin.
3. Erfinde nichts. Was nicht im Dokument steht, lässt du leer.
4. BEWERTE NICHTS (nicht abzugsfähig/umlagefähig/abrechenbar) und buche nichts — das macht ein Mensch.

Gib den Datensatz als Feldliste aus, die ich vor der Übernahme prüfe — Beträge und Mengen besonders.

Bei dir bindet das Abtippen von Belegen oder Formularen Zeit, die woanders fehlt? Dann reden wir über die eine Belegart, die bei euch am häufigsten reinkommt — und ich sage dir ehrlich, wie viel sich da geprüft automatisieren lässt und wo die Handschrift dem Ganzen Grenzen setzt.