23-09-24 02:45 AM
안녕하세요! IDP 실습 관련 추가 문의 드립니다.
일전에 BluePrism Korea 에서 가이드 및 좋은 교육 자료를 제공해주셔서 기본적인 개념은
잘 익혔습니다. 감사드립니다.
추가적으로 이제는 통장사본 처리를 해보고 있는데요.
관련해서 궁금한 사항 몇 가지 질문 드리고자 합니다.
1. 통장사본 - 번호 데이터의 인식율을 높이는 방법 문의
제가 통장사본 이미지를 batch 로 IDP업로드 해서 인식되는 것을 관찰해보니
이미지(jpeg, pdf, png 등등) 화일 자체의 해상도가 높은 경우에는 큰 무리가 없었으나,
스캔된 이미지의 해상도나 선명도가 떨어지는 경우(사실 현업에서는 이런 경우가 대다수)에는
아래처럼 스캔 이미지의 통장번호(숫자와 하이픈 - 의 조합, 예) 219-196365-13-001 )는
잘 인식을 못하는 경우가 있었습니다.
DFD(Document Form Definitions) 속성을 정의할 때 우선 아래와 같이 설정했습니다.
제가 바람직하게 속성 설정을 한 것인지 문의 드립니다. 또한 관련해서, 인식율을 높이는 추가 tip 이 있을까요?
Format : Text
Flags : Assignable, Required
Format expression : ^[0-9-]{12,17}$ <--- 0과9의 숫자와 - 하이픈으로 이루어졌고, 12자리 이상이면서 17자리 이하인 문자로 정규식 정의
Keywords : 계 좌 번 호, 계좌번호, 계좌
2. BP 에서 IDP 로 batch 액션 시, New Batch Details.Folder Path (업로드할 문서의 폴더 경로) 를 참조해서
IDP로 화일을 던지게 될 때 , 분석 대상이 아닌 자료를 자동으로 제외 가능한지 문의
예를 들어서, C:\test 라는 폴더에
A.pdf (통장사본 자료)
B.pdf (통장사본 자료)
C.pdf (엉뚱한 자료, 판독 대상이 아닌 자료)
위와 같은 화일 구성이 되어 있으면, 처리할 필요가 없는 C.pdf 화일을 IDP 에서 자동으로 예외처리하거나 무시하게끔 할 수 있는지 문의 드립니다.
(IDP 웹 관리자 페이지에서 'Data Verification' 탭에서 사람이 수동 확인하지 않는 상황을 가정)
25-09-24 01:09 AM
유상준 차장님 안녕하세요,
블루프리즘 코리아 신홍준 대리입니다.
작성해주신 글 잘 읽어 보았습니다.
[유상준 차장님] 1. 통장사본 - 번호 데이터의 인식율을 높이는 방법 문의
저희 Decipher는 문서의 해상도 품질의 권장사항이 300DPI로 되어 있습니다. 해당 권장사항보다 낮을 경우, 인식하는데 어려움이 있을 수도 있습니다.
혹시, Decipher 에서 Document Type, Batch Type 설정 시, Primary Language 와 Secondary Language가 Korean, Korean 이 아닌 Korean, English 혹은 English, Korean으로 설정하고 해보실 수 있을까요?
[유상준 차장님]2. BP 에서 IDP 로 batch 액션 시, New Batch Details.Folder Path (업로드할 문서의 폴더 경로) 를 참조해서
IDP로 화일을 던지게 될 때 , 분석 대상이 아닌 자료를 자동으로 제외 가능한지 문의
현재 Decipher에서 서로 다른 문서 파일을 넣고, 말씀하신대로 C문서 파일을 제외하는 기능은 아직은 없습니다.
하지만, 아래와 같은 방법으로 구성을 하시면 가능합니다.
1. A,B,C 문서파일을 Classification Model에 학습
2. A,B,C 문서를 Decipher에 업로드
3. 분류된 결과를 BPE에서 가져오기(문서 종류, 문서 이름 등등..)
4. 분류된 문서 종류별로 BPE File management VBO를 활용해서 폴더생성 후 각 폴더 별로 해당되는 문서 저장
5. 분류된 폴더별로 다시 Decipher에 문서 제출( A문서, B문서 , C문서는 제외)
위외 같이 진행하면 가능 할 것 같습니다!
아래는 실제 제가 테스트를 진행한 것입니다.
PO, BL문서를 이메일에서 다운로드 후
각각 문서 분류까지만 진행을 하고
BLDemo, PLDemo 폴더를 생성 후 각각 폴더에 해당되는 문서를 저장합니다.
<BLDemo 폴더>
<PODemo 폴더>
감사합니다.
신홍준 드림.