Tab Tabelle
Unter dem Kartenreiter Tabelle werden allgemeingültige Einstellungen vorgenommen, um die Tabelle als Ganzes zu konfigurieren.
Feld / Schaltfläche | Beschreibung |
---|---|
Tabelle verwenden | Erst wenn diese Option aktiviert wird, kann eine Tabelle konfiguriert werden. Für die Erfassung von Tabelleninhalten muss mindesten eine Spalte konfiguriert werden. |
Referenztext für Kopfzeile | Angabe von Wörtern, welche in der Kopfzeile vorkommen (z.B. Pos, Artikelnummer, Gesamtpreis, etc.). Eine Kopfzeile wird erst erkannt, wenn mindesten zwei der angegebenen Wörter erkannt wurden. Gibt es mehrere Textzeilen, in denen die angegebenen Wörter vorkommen, wird die Textzeile als Kopfzeile verwendet, in der die meisten der angegebenen Wörter enthalten sind. Es ist nicht unbedingt notwendig, Wörter für Kopfzeilen anzugeben, jedoch erhöht dies die Erkennungsqualität, da sonst Texte außerhalb der Tabelle einer Tabellenzeile zugeordnet werden könnten. |
Kopfzeile muss existieren | Kennzeichen, ob eine Kopfzeile existieren muss. Dieses Kennzeichen sollte gesetzt werden, wenn sichergestellt ist, dass die Kopfzeile auch auf allen Folgeseiten vorhanden ist, wenn sich die Tabelle auf mehrere Seiten erstreckt. Wird keine Kopfzeile erkannt (oder ist keine vorhanden), wird der obere Seitenrand als Tabellenbeginn verwendet. |
Kopfzeile muss alle Texte enthalten | Mit diesem Kennzeichen kann erzwungen werden, dass alle beim Referenztext für die Kopfzeile angegebenen Wörter in der Kopfzeile enthalten sein müssen. Bei eingescannten Belegen kann dies jedoch zu Problemen führen, wenn eine hohe Scanqualität (und damit Erkennungsqualität) nicht sichergestellt werden kann. |
Referenztext für Fußzeile | Angabe von Wörtern, welche in der Fußzeile vorkommen (z.B. Übertrag, Endbetrag, etc.). Hier gelten die gleichen Bestimmungen wie bereits bei Referenztext für Kopfzeile beschrieben. |
Fußzeile muss existieren | Kennzeichen, ob eine Fußzeile existieren muss. Dieses Kennzeichen sollte gesetzt werden, wenn sichergestellt ist, dass die Fußzeile auch auf allen Folgeseiten vorhanden ist, wenn sich die Tabelle auf mehrere Seiten erstreckt. Wird keine Fußzeile erkannt (oder ist keine vorhanden), wird der untere Seitenrand als Tabellenende verwendet. |
Fußzeile muss alle Texte enthalten | Mit diesem Kennzeichen kann erzwungen werden, dass alle beim Referenztext für die Fußzeile angegebenen Wörter in der Fußzeile enthalten sein müssen. Bei eingescannten Belegen kann dies jedoch zu Problemen führen, wenn eine hohe Scanqualität (und damit Erkennungsqualität) nicht sichergestellt werden kann. |
Tabelle enthält Seitenumbrüche innerhalb von Positionen | Dieses Kennzeichen sollte nur dann auf Ja gesetzt werden, wenn innerhalb von Tabellenzeilen ein Seitenumbruch stattfinden kann. In diesem Fall werden alle Inhalte zwischen der der Kopfzeile und der ersten Tabellenzeile der Seite der letzten Tabellenzeile der vorherigen Seite zugeordnet. Konnte keine Kopfzeile ermittelt werden, dann werden folglich alle Inhalte oberhalb der ersten Tabellenzeile zugeordnet. Nicht erwünschte Texte (z.B. Übertrag) können bei der jeweiligen Spalte ausgeklammert werden. |
Unschärfe für Zeile | Die Einstellungsmöglichkeit Unschärfe für Zeile gibt für den jeweiligen Bereich an (oben, unten oder beides), um wieviel Millimeter die angegebenen Werte von einer geraden Zeile abweichen können und dennoch als jeweiliger Referenztext erfolgreich zugeordnet werden. Dies ist primär nur dann relevant, wenn der Blatt-Einzug des Scanners die Belege schief einzieht. |
Ausschlusskriterium für Tabellenzeilen | Hier kann ein regulärer Ausdruck für den Ausschluss von Tabellenzeilen angegeben werden. Dies ist z.B. dann notwendig, wenn Gruppensummen nicht in die Liste der Rechnungspositionen übernommen werden sollen. Als einfacher regulärer Ausdruck für Gruppensummen könnte also lauten: “Summe:|Summe\sDienstleistung“ |
Tab Kartenreiter2
<Bild>
<Beschreibung>
Feld / Schaltfläche | Beschreibung |
---|---|
Tab Kartenreiter3
<Bild>
<Beschreibung>
Feld / Schaltfläche | Beschreibung |
---|---|
Screenshot Erfassungsvorlage: Tabellenbereich
Im Bereich Tabelle kann eine Positionsauswertung (Tabelle) konfiguriert werden, beispielsweise Rechnungspositionen auf einer Rechnung.
Screenshot Erfassungsvorlage: Tabellenbereich: Kopf- und Fußzeile der Tabelle
Für die Positionsauswertung muss zunächst der Anfang (Kopfzeile) und dann das Ende (Fußzeile) der Tabelle definiert werden. In den jeweiligen „Referenztextfeldern“ können Werte eingetragen werden, die möglichst häufig den Anfang oder das Ende der Tabelle identifizieren. Wie im nachfolgenden Beispiel zu sehen, wurden die Spaltenköpfe je Spalte als Anfang der Tabelle festgelegt.
Screenshot Erfassungsvorlage: Tabellenbereich: Kopf- und Fußzeile der Tabelle: Grafik
Die Einstellungsmöglichkeit „Unschärfe für Zeile“ gibt für den jeweiligen Bereich an (oben, unten oder beides), um wieviel Millimeter die angegebenen Werte von einer geraden Zeile abweichen können und dennoch als jeweiliger Referenztext erfolgreich zugeordnet werden.
Hinweis |
---|
Je mehr Werte für den jeweiligen Referenztext angegeben werden (Kopfzeile oder Fußzeile der Tabelle), desto höher ist eine erfolgreiche Identifizierung. |
Screenshot Erfassungsvorlage: Tabellenbereich: Spalten der Tabelle: Grafik
Zur Auswertung der Spalten in der Tabelle muss je Spalte, die ausgelesen werden soll, eine Position hinzugefügt werden. Das Hinzufügen und Entfernen von Positionen erfolgt über die Schaltflächen .
Screenshot Erfassungsvorlage: Tabellenbereich: Spaltenkonfiguration
Im Feld „Bezeichnung“ wird die aktuell erfasste Spalte benannt.
Im Feld „Datentyp“ kann festgelegt werden, welchem Format der auszulesende Wert entspricht. Ist ein „Datentyp“ festgelegt, werden nur entsprechende Werte erkannt, nicht aber Werte, die einem anderen „Datentyp“ entsprechen.
Verfügbare „Datentypen“ sind:
Text (der Wert kann aus Buchstaben, Ziffern oder Sonderzeichen bestehen)
Ganzzahl (der Wert kann aus Ziffern bestehen)
Kommazahl (der Wert kann aus Ziffern, die mit einem Zeichen getrennt sind, Beispiel: . (Punkt) , (Komma) bestehen)
Datum (der Wert entspricht einem Datumsformat, Beispiel: 01.01.2017 oder 01.01.17)
Im Feld „Leerzeichen ignorieren“ kann festgelegt werden, ob bei der Erkennung eines Wertes alle erkannten Leerzeichen ignoriert werden sollen.
Im Feld „Textlänge“ kann die minimale sowie maximale Zeichenlänge eines Wertes festgelegt werden.
Im Feld „Mehrzeilig“ wird festgelegt, ob der Wert innerhalb der Spalte aus mehreren Zeilen bestehen kann (häufig zu verwenden bei längeren Artikelbezeichnungen). Im Beispiel zu sehen an der Spalte Text und der ersten Artikelposition:
Screenshot Erfassungsvorlage: Tabellenbereich: Grafik Mehrzeilig
Im Feld „Inhalt spaltenübergreifend“ wird festgelegt, ob der Wert in einer nachfolgenden Spalte vorkommen kann (häufig zu verwenden bei längeren Artikelbezeichnungen). Im Beispiel zu sehen an der Spalte Bezeichnung und der dritten Artikelposition:
Screenshot Erfassungsvorlage: Tabellenbereich: Grafik Inhalt Spaltenübergreifend
Im Feld „Identifiziert neue Zeile“ wird festgelegt, durch welchen Wert in der Artikelzeile eine neue Artikelposition erkannt werden soll. Es können auch mehrere Spalten als Identifizierung einer neuen Artikelposition festgelegt werden.
Im Einstellungsbereich „Unschärfe für Spalte“ wird festgelegt, um wieviel Millimeter die festgelegten Spaltenbreiten abweichen können und dennoch die Inhalte erfolgreich erkannt werden (links, rechts oder bei beidem).
Einstellungsbereich für „Reg. Ausdruck“ (regulärer Ausdruck):
Mit regulären Ausdrücken können aus dem Dokument ausgelesene Werte auf Richtigkeit überprüft werden. Nur wenn der ausgelesene Wert dem konfigurierten regulären Ausdruck entspricht, wird der Wert ausgelesen.
Beispiel: Das Dokumentendatum soll auf Richtigkeit geprüft werden und nur dann, wenn es dem regulären Ausdruck entspricht, ausgelesen werden.
Dokumentendatum = 01.01.2017 | Regulärer Ausdruck = [0-9]{1,2}.[0-9]{1,2}.[0-9]{2,4} |
Erklärung [0-9]: Nur die Ziffern von 0-9 sind erlaubt. | |
Erklärung {1,2}: Die Ziffern sind Ein- oder Zweistellig. | |
Erklärung . : Nach den Ziffern (Ein- oder Zweistellig) kommt ein Punkt (.). |
Weiterhin kann im Falle einer erfolgreichen Prüfung durch den regulären Ausdruck der erkannte Wert durch einen definierten Inhalt ersetzt werden (= „Ersetzungstext für reguläre Ausdrücke“). Hier kann noch festgelegt werden, ob der zuerst zutreffende Wert erkannt werden soll, oder ob alle zutreffenden Werte, getrennt durch ein definiertes Zeichen, erkannt werden sollen.
Weitere Beispiele zu den regulären Ausdrücken, können hier nachgelesen werden: Reguläre Ausdrücke
Hinweis |
---|
Reguläre Ausdrücke sind keine Erfindung der Accantum GmbH. Diese sowie weitere Beispiele können ebenfalls im Internet auf gängigem Wege nachgeschlagen werden. |
Sobald alle Spalten konfiguriert sind, muss mit dem Mauszeiger direkt auf dem Dokument (rechter Fensterbereich) noch die richtige Spaltenbreite je Spalte gezogen werden, sodass die festgelegten Spalten nur ihren eigenen Bereich abdecken:
Nach korrekter Spaltenkonfiguration sowie manuellem Festlegen der jeweiligen Spaltenbreite sind die Tabelleninformationen im linken Fensterbereich zu sehen:
Hinweis |
---|
Die ausgelesenen Tabelleninformationen können nur per Export (nächster Einstellungsbereich, Tab Einstellungen) zur Verfügung gestellt werden! |