18-12-20 12:42 AM
Hola a todos, necesito leer PDFs para obtener su información... tengo instalada la versión Blue Prism 6.7.2, ¿Habrá algún componente que me pueda ayudar?
gracias...
Saludos!
18-12-20 01:43 PM
Hola Samuel!
Podés llegar a generar un objeto que haga esa lectura. Te recomiendo utilizar las DLL de Spide.PDF.
El código para poner en el objeto es simple (a modo ejemplo, la vas a tener que poner en parámetros a las rutas de origen y destino)
PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile(@"C:\000\origen.pdf");
pdf.SaveToFile(@"c:\000\salida.xlsx", FileFormat.XLSX);
Otra posibilidad es utilizar la DLL itextsharp o PDFBox, pero esta solamente te deja extraer el contenido como texto:
Con PDFBox sería algo así:
PDFParser pdfParser = new PDFParser();
String result = pdfParser.ExtractText(pdfFile);
18-12-20 01:44 PM
Hola Samuel
Primero que todo revisaste las opciones que tiene el Digital Exchange? https://digitalexchange.blueprism.com/dx/search?keyword=pdf&sortOrder=lastApprovalDate_desc&page=1
Otra opción es hacer una utilidad a la medida para la lectura de PDF, si tienes acceso a itextsharp por ejemplo puedes implementar el código en un objeto, aquí te dejo un ejemplo en c# para esta librería.
PdfReader reader = new PdfReader(InputFile);
string text = string.Empty;
for(int page = 1; page <= reader.NumberOfPages; page++) {
text += PdfTextExtractor.GetTextFromPage(reader,page);
}
reader.Close();
OutText = text;
Saludos
18-12-20 01:54 PM
Hola Jose Gleiser,
Gracias, aún no reviso la parte de DX o si tengo acceso a itextsharp, revisaré sobre lo que me compartes... estamos comenzando a revisar opciones... he leído algo sobe Decipher pero no se si tiene un costo adicional.
Saludos!
18-12-20 02:21 PM
iTextSharp es una DLL gratuita. El tema es que tenés que desarrollar vos el objeto introduciendo código de .NET
Decipher creo que no tiene costo adicional, pero requiere toda una infraestructura para usarlo (incluso la última versión del SQL server) y además utiliza el Runtime Resource al completo. No es que se trate de un objeto que puedas utilizar dentro de tu proceso, sino que tenés que hacer un proceso de extracción de datos y luego utilizar esa salida en tu proceso.
18-12-20 04:05 PM
Gracias Anibal, revisare las diferentes opciones, entre ellas la opción de iTextSharp, en mi caso no tendría problema con la parte de .NET
Saludos!
21-12-20 06:26 PM
Gracias Anibal y todos, revisará todas las DLLs para ver cual me funciona mejor...
Saludos!
11-02-21 10:58 AM
11-02-21 02:14 PM
Hola Jesús,
De hecho finalmente esa fue la opción por la que nos fuimos y estamos construyendo la solución actualmente... gracias...
Saludos!