Hallo zusammen,
wir benutzen zum ersten Mal die OCR Erkennung auf eingescannte PDF-Formualre und kommen auf komische Ergebnisse.
Wir benutzen die read Action mit Read Text with OCR:
Hier sieht man ein Beispiel aus dem Auszug aus der PDF-Datei:
Hier wird das Wort Straße, das ß -Zeichen mit einem B gefunden und München als Miunchen gefunden.
Scale usw. bringt keinen Erfolg.
Weiter unten bei der Reader Properties ist uns aufgefallen das man hier ein Language Pack hinterlegen kann., aber es gibt leider keine Beschreibung die ich gefunden habe wie dies gehen soll.
Auf jedenfall wenn man hier DEU oder GER einträgt, bekommt man eine Fehlermeldung:
Optical character recognition (OCR) (blueprism.com)Die Tesseract ist nicht mehr verfügbar in dem oben genannten Link
und in deiesem Link auch nicht mehr:
Read Text with OCR - Learn Robotic Process Automation (dotnetbasic.com)hat jemand eventuell eine Lösung oder eine Idee mit der ich das Ganze verbessern kann. Eventuell eine andere OCR Erkennungssoftware benutzen?
Oder wie macht ihr das bei euch? Benutzt ihr den Standard von Blue Prism oder benutzt ihr eine spezielle Software bezüglich OCR Erkennung auf die dann Blue Prism zugreift?
------------------------------
Robert Roginer
RPA Modeller
Mainova
Europe/Berlin
------------------------------