sitelink1 https://mainia.tistory.com/m/439 
sitelink2  
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

스캔을 뜬 책을 하나 구했는데 이것을 텍스트로 전환하면 보기 더 편하지 않을까 해서,

그 방법에 대해 여러가지로 찾아보게 되었다. 역시나 나의 고민은 새로운게 아니였다.

수많은 프로그램과 사이트가 제공되고 있었다. 그 내용에 대한 정리를 해본다.

 

이미지에서 텍스트를 출력하는 기술은 OCR(Optional Character Recongnition) 이라고 한다.

이런 기능을 제공하는 무료프로그램과 사이트는 많이 있다.

 

한국인이 만든 무료 OCR 프로그램 사이트 :

http://home.megapass.co.kr/~woosjung/Product_JOCR.html

00.jpg

 

http://softi.co.uk/freeocr.htm

01.jpg

 

위에서 제시한 사이트는 프로그램을 다운받아서 사용하지만 네이버에서 제공하는 OCR은

웹상에서 기능을 사용할수 있다. 개인적으로 제일 편리하고 좋은 것 같다.

http://t.lab.naver.com/ocr/
02.jpg

 

이미지 올리기 버튼을 클릭하여 파일을 올리면 이미지 적합성 여부와 인식률에 대한 정보가

나오게된다

03.jpg

 

이미지 문자 인식실행을 하게 되면 아래 화면과 같이 추출한 문자열이 텍스트 박스에 나오게된다

그리고 텍스트 파일로 저장할수 있다

04.jpg

 

MS Office 2003 에서 제공하는 텍스트 전환기능

Microsoft Office Document Imaging 실행한다

05.jpg

 

프로그램이 실행되면 스캔한 이미지나 확장자가 tiff, tif, mid 이미지 파일을 연다.

그러면 왼쪽에 축소된 이미지와 오른쪽에 확대된 이미지를 볼수 있을것이다

 

06.jpg

 

다음은 이미지에 들어있는 텍스트를 추출해본다.

도구 > OCR을 사용하여 텍스트 인식을 클릭한다

07.jpg

 

만약 설치 되지 않았으면 자동으로 설치해준다. 다 되었으면 드래그를 해보자. 텍스트 추출이

된 것은 그림과 같이 선택이 될것이다. 이것을 복사해서 쓰면되고 word 를 생성해서 보내고

싶다면 도구 > Word 로 텍스트 보내기 메뉴를 선택한뒤 창에 정보를 입력하고 저장하면된다

08.jpg

 

아래 그림은 워드로 추출한 내용인데 원본그림과 비교해보면 글자에 언더바가 있는부분은

추출을 못했다. 이 부분은 인식을 하지 못하나 보다

09.jpg

 

MS Office 2007 에서 제공하는 텍스트 전환기능

별도의 플러그인만 설치해주면 바로 PPT 파일 등을 다른이름으로 저장할 때 PDF 형태로 변환이 하다. 플러그인을 설치하기 위해서는 아래 주소에 가서 다운받는다.

http://www.microsoft.com/downloads/details.aspx?FamilyID=4D951911-3E7E-4AE6-B059-A2E79ED87041&displaylang=en&Hash=VM5qPiVObmsfUbk6fuPsgQfCSxW8qbU6M2cV4ht1%2bRWrQpeafeNQIpDuqlJV5GqeknkrT7yJ4yFv9AHX5IEDhQ%3d%3d

 

10.jpg

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

번호 제목 글쓴이 날짜 조회 수
공지 2023 Software Development Trend 정리 황제낙엽 2024.01.19 1
148 REST, REST API, RESTful [2] 황제낙엽 2021.01.11 91097
147 Character Entity Set(s) 황제낙엽 2013.06.24 55399
146 엑셀(excel)에서 16진수 -> 10진수 변환 file 황제낙엽 2017.08.29 4294
145 설치형 블로그, 위키, 게시판 모음 황제낙엽 2006.09.20 4131
144 반올림하는 두 가지 방법 (Round-off(사사오입), Round-to-nearest-even(오사 오입)) file 황제낙엽 2019.08.27 1335
143 notepad2 에서 문서내의 일부 문자열의 byte 크기 알아내기 file 황제낙엽 2018.03.29 1202
142 부동소수점 연산에 관한 정리 황제낙엽 2018.03.26 1040
141 컴퓨터는 음수를 2의 보수법으로 표현한다 file 황제낙엽 2016.10.24 753
140 효과적인 모바일 애니메이션 응용예 file 황제낙엽 2018.03.30 671
139 2020 클라우드 정리 - cloud, aws, azure, gcp, iaas, paas, saas 황제낙엽 2020.04.05 664
138 XQL 황제낙엽 2003.07.10 576
137 아웃룩(Outlook 2010) 메일 보관 경로(.pst) 변경과 백업/복구 file 황제낙엽 2009.12.28 504
136 2019년 웹 프레임워크 인기 순위 file 황제낙엽 2020.04.06 470
135 음성인식서비스 개발을 위한 음성 API 모음(STT API) 황제낙엽 2019.04.28 465
134 자료구조 Part1. "동적배열"의 모든 것. 황제낙엽 2007.11.24 431
133 소프트웨어 개발 환경 갖추기 황제낙엽 2006.09.21 408
132 사랑비 BGM 보안 취약점 황제낙엽 2008.08.02 405
131 Web 2.0이란 무엇인가 : 다음 세대 소프트웨어를 위한 디자인 패턴 및 비즈니스 모델(2) 황제낙엽 2007.11.20 383
130 변수를 unsigned int형 선언 0xffffffff 할당 결과가 -1이 되는 이유는? 황제낙엽 2016.10.24 376
129 EULA (End User License Agreement) ; 소프트웨어 사용자 라이선스 계약 황제낙엽 2015.06.26 368