meeyeon
80
2021-04-06 13:49:28
2
161

pdf 필드 내용을 db에 저장하고 싶습니다. 도와주세요ㅠㅠ


안녕하세요 신입 개발자입니다. 

제목 그대로 pdf 각각 필드에 입력한 값들을 db에 저장하는 방법을 

구글에서 찾다 찾다 모르겠어서 질문드립니다.

pdf 는 adobe acrobat 사용중입니다.

방법을 아시는분 계시면 답변 좀 꼭 부탁드립니다 ㅠ_ㅠ 

0
  • 답변 2

  • BalanceE
    522
    2021-04-06 14:07:57

    pdf파일을 text 파일로 변환하든, pdf파일을 읽는 라이브러리를 사용하든, 파일 내용을 읽어

    원하는 형태로 파싱하고 DB에 넣습니다.

    각각 필드에 입력한 값들 <-- 이게 무슨소린지 정확히 모르겠지만 pdf파일 내에 규칙적으로 테이블형태의 데이터가 있다고 하면 정규식이든 특정 규칙이든으로 나누어서 처리해야겠네요

  • 라이칸
    589
    2021-04-06 14:57:42

    ocr 기능 사용해서  pdf 파일에 내용 텍스트 추출한다음에 데이터 DB 넣으면 될거같네요

    대신 ocr 기능이 좋아졌다고하더라도 인식 못하는경우가 있어서 계속 모니터링해야할거에요

    그거아니면  돈주고 사용하는 ocr 기능으로 추출해야하고요 

  • 로그인을 하시면 답변을 등록할 수 있습니다.