cancel
Showing results for 
Search instead for 
Did you mean: 

Lectura de PDF

SAMUELPIZANO
Level 3

Hola a todos, necesito leer PDFs para obtener su información... tengo instalada la versión Blue Prism 6.7.2, ¿Habrá algún componente que me pueda ayudar?

gracias...

Saludos!



------------------------------
SAMUEL PIZANO
CONSULTOR TI
MABE
America/Mexico_City
------------------------------
8 REPLIES 8

Hola Samuel!

Podés llegar a generar un objeto que haga esa lectura. Te recomiendo utilizar las DLL de Spide.PDF.

El código para poner en el objeto es simple (a modo ejemplo, la vas a tener que poner en parámetros a las rutas de origen y destino)

PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile(@"C:\000\origen.pdf");
pdf.SaveToFile(@"c:\000\salida.xlsx", FileFormat.XLSX);

Otra posibilidad es utilizar la DLL itextsharp o PDFBox, pero esta solamente te deja extraer el contenido como texto: 

Con PDFBox sería algo así:

PDFParser pdfParser = new PDFParser();
   
String result = pdfParser.ExtractText(pdfFile);


------------------------------
Aníbal Facundo Urrestarazu
Lead Developer
Ctrl365 - Argentina
------------------------------

JoseGleiser
Level 3

Hola Samuel

Primero que todo revisaste las opciones que tiene el Digital Exchange? https://digitalexchange.blueprism.com/dx/search?keyword=pdf&sortOrder=lastApprovalDate_desc&page=1

Otra opción es hacer una utilidad a la medida para la lectura de PDF, si tienes acceso a itextsharp por ejemplo puedes implementar el código en un objeto, aquí te dejo un ejemplo en c# para esta librería.

PdfReader reader = new PdfReader(InputFile);

string text = string.Empty;

for(int page = 1; page <= reader.NumberOfPages; page++) {
	text += PdfTextExtractor.GetTextFromPage(reader,page);
}

reader.Close();

OutText = text;

Saludos



------------------------------
Jose Gleiser
Head of Automation CoE
BCI
America/Santiago
------------------------------

Hola Jose Gleiser,

 

Gracias, aún no reviso la parte de DX o si tengo acceso a itextsharp, revisaré sobre lo que me compartes... estamos comenzando a revisar opciones... he leído algo sobe Decipher pero no se si tiene un costo adicional.

 

Saludos!




AVISO DE CONFIDENCIALIDAD Y ALCANCE DE CONTENIDO
Este correo es para el uso exclusivo del destinatario (s) y puede contener información confidencial y/o privilegiada. Si usted no es el destinatario original, no debe abrir, usar, publicar, distribuir, copiar o usar como base este mensaje o archivo adjunto. Cualquier revisión, retransmisión, diseminación, o cualquier otro uso o acción relacionada con esta información ya sea por personas o entidades distintas a los recipientes a los que ha sido dirigida, esta prohibida. Si usted ha recibido este e-mail por error, favor de destruir inmediatamente todas las copias del mensaje original y notifique al remitente.
Mabe no acepta responsabilidad por cualquier error, omisión, corrupción o virus en el contenido de este mensaje o cualquier archivo adjunto.

CONFIDENTIAL AND DISCLAIMER NOTICES
This e-mail message is exclusively for the destinatary, may contain privileged or confidential information. If you are not the intended recipient, you may not disclose, use, disseminate, distribute, copy or rely upon this message or attachment in any way. If you received this e-mail message in error, please destroy it immediately and return by forwarding the message and its attachments to the sender.
Mabe and its affiliates do not accept liability for any errors, omissions, corruption or virus in the contents of this message or any attachments.


iTextSharp es una DLL gratuita. El tema es que tenés que desarrollar vos el objeto introduciendo código de .NET

Decipher creo que no tiene costo adicional, pero requiere toda una infraestructura para usarlo (incluso la última versión del SQL server) y además utiliza el Runtime Resource al completo. No es que se trate de un objeto que puedas utilizar dentro de tu proceso, sino que tenés que hacer un proceso de extracción de datos y luego utilizar esa salida en tu proceso. 



------------------------------
Aníbal Facundo Urrestarazu
Lead Developer
Ctrl365 - Argentina
------------------------------

Gracias Anibal, revisare las diferentes opciones, entre ellas la opción de iTextSharp, en mi caso no tendría problema con la parte de .NET

 

Saludos!

 



Gracias Anibal y todos, revisará todas las DLLs para ver cual me funciona mejor...

 

Saludos!




AVISO DE CONFIDENCIALIDAD Y ALCANCE DE CONTENIDO
Este correo es para el uso exclusivo del destinatario (s) y puede contener información confidencial y/o privilegiada. Si usted no es el destinatario original, no debe abrir, usar, publicar, distribuir, copiar o usar como base este mensaje o archivo adjunto. Cualquier revisión, retransmisión, diseminación, o cualquier otro uso o acción relacionada con esta información ya sea por personas o entidades distintas a los recipientes a los que ha sido dirigida, esta prohibida. Si usted ha recibido este e-mail por error, favor de destruir inmediatamente todas las copias del mensaje original y notifique al remitente.
Mabe no acepta responsabilidad por cualquier error, omisión, corrupción o virus en el contenido de este mensaje o cualquier archivo adjunto.

CONFIDENTIAL AND DISCLAIMER NOTICES
This e-mail message is exclusively for the destinatary, may contain privileged or confidential information. If you are not the intended recipient, you may not disclose, use, disseminate, distribute, copy or rely upon this message or attachment in any way. If you received this e-mail message in error, please destroy it immediately and return by forwarding the message and its attachments to the sender.
Mabe and its affiliates do not accept liability for any errors, omissions, corruption or virus in the contents of this message or any attachments.


Llego algo tarde, pero según la documentación de Blueprism (es una de las preguntas de su examen de certificación profesional) la forma de extraer texto de un pdf haciendo uso de blueprism es a través de send keys.

Primero hacer Control + A --> ^a
Después Copiar --> ^c

y después a través de las propias actividades recuperar el texto del clipboard.

Espero que te haya podido servir de ayuda para no tener que generar bloques de código.

Un saludo.

------------------------------
Jesús Miguel Bravo Díaz
RPA Developer
Atento
Europe/Madrid
------------------------------

Hola Jesús,

 

De hecho finalmente esa fue la opción por la que nos fuimos y estamos construyendo la solución actualmente... gracias...

 

Saludos!