전자기기/Software

PDF 수정 및 원본 PDF에서의 글자 추출

cchucchu 2018. 11. 30. 09:00
반응형

정말 오랜만에 윈도우 카테고리에 포스팅을 하게 되었습니다.


학교 과제에서 보고서를 쓰며 PDF에서 글자 추출에 관련된 유틸을 찾던 중 정말 유용한 유틸인


'알 PDF'를 찾아 사용 방법에 대한 대략적인 내용을 기록하기 위해 포스팅을 계획하였습니다.




우선 알PDF는 프리웨어입니다.


네이버 자료실에서도 다운로드 받으실 수 있습니다.


https://software.naver.com/software/summary.nhn?softwareId=GWS_001846


위 링크를 타고 들어가시게되면



위의 홈페이지에서 다운로드가 가능합니다.


그리고 설치방법에서는 다른 선택없이 직관적이므로 충분히 혼자서도 설치가 가능합니다.


그리고 설치를 하게 되었을 때 나타나는 처음 기본 화면입니다.



이는 이전에 포스팅했던 smallpdf에서의 기능인 pdf생성, 변합, 변환이 가능합니다.


이러한 기능들도 있고 정말 제가 유용했던 문자 인식 (OCR) 사용방법 입니다.


이 또한 매우 간단합니다.


우선 예시를 들어 기사 스크랩에서 글자를 추출하는 방법에서 예시를 들어보도록 하겠습니다.



저는 예시를 들어 이번 학교 과제에서의 팀프로젝트인 'IGCC'에 관련 기사에서 글자를 추출해


보도록 하겠습니다. 


위의 이미지에서와 같이 빨간박스를 선택해줍니다.


(기사 스크랩 출처 : http://www.energycenter.co.kr/news/articlePrint.html?idxno=423)




이 후 위의 팝업 창이 뜨게 되는데 기본적으로 모든 페이지로 설정되어 있습니다.


일부 페이지 만을 문자인식 시키기 위해선 빨간 박스를 클릭하여 일반 한글이나, PDF에서 


어디부터 어디까지 인쇄할 것을 정하는 것과 같이 설정을 해주시면 됩니다.




로딩창이 뜨게 됩니다. 의외로 페이지가 많을 경우에는 어느정도 시간이 소모됩니다.




이와 같이 하나의 창이 더 뜨는 것을 보실수가 있습니다.


이제 여기서 빨간박스 안에있는 문구편집을 선택해줍니다.



그러면 결과적으로 이와 같이 PDF에 있는 한 글 문자도 모두 인식이 되는 것을 보실수가 있습니다.










이번 유틸은 정말 도움이 많이 되겠다고 생각되어 포스팅을 해보았습니다.


앞으로도 유틸에 관련된 내용들은 그때 그때 올리도록 하겠습니다.


정말 유용한 유틸이며 프리웨어 이므로 많으신 분들이 이를 이용해, 직장, 대학생의 과제 등에


이용하면 좋을 것 같습니다.

반응형