Automatische Texterkennung

Das System wendet standardmäßig auf alle lesbaren Dokumente eine automatische Volltextindizierung (OCR) an. ecoDMS setzt hierbei auf die freie Texterkennungssoftware "Tesseract". Diese erzielt sehr gute Ergebnisse bei der Volltextindizierung und Texterkennung und ermöglicht sogar die automatische Vorklassifizierung von Dokumenten. Auch die Dokumentensuche ist Dank der integrierten OCR kinderleicht. Der Benutzer muss lediglich die gesuchten Begriffe in die Suchzeile eingeben und schon werden die passenden Ergebnisse ausgegeben. Die OCR Funktionalität ist fest in ecoDMS eingebaut.

Umwandlung in lesbare PDF/A Dateien

Darüber hinaus wandelt ecoDMS nicht lesbare Daten wie z.B. nicht lesbare PDFs, JPGs, PNGs und TIFFs automatisch in lesbare PDF/A Dateien um, sodass evtl. enthaltene Texte aus diesen Dateien ebenfalls bei der Volltextsuche mit einbezogen werden können. Insgesamt ist die Liste der von der OCR erkannten Formate über 200 Einträge lang.

Funktion verfügbar für Windows, Ubuntu, Debian, MacOS
perm_phone_msg
arrow_upward