본문 바로가기
물건

내가 쓰는 iX500 스캐너 설정

by @푸근 2014. 8. 16.

iX500 스캐너를 가지고 이렇게 저렇게 해봤습니다. 어차피 OCR이 가능한 PDF 형식으로 저장할 것이기 때문에 바꿀 수 있는 설정은 품질 정도밖에 없습니다. 그래서 몇 가지 간단한 테스트만 해보고 다음과 같은 설정으로 사용하기로 했습니다.

 

설정을 따지기 전에, 저는 용량보다는 품질을 우선으로 생각합니다. 구글 플레이북 앱으로 1000개의 pdf파일을 개인이 업로드해서 볼 수 있습니다. 이때 용량 제한이 한 파일당 100MB입니다. 이 정도만 넘기지 않는다면 용량은 신경쓰지 않습니다. 그런데 실제로 스캔해보니 200쪽 책 한권 스캔해봐야 100MB는 커녕 그 반도 되질 않더군요. 그래서 가능한한 품질을 높이기로 했습니다.

 

 

먼저, 이미지 화질은 Super Fine으로 결정했습니다. 이미지 화질은 자동/노말/파인/슈퍼파인/엑설런트 이렇게 5가지 중 하나를 고르게 되어 있고, 기본값은 자동입니다. 그러나 몇 번 테스트해 보니 자동은 대체로 노말 수준으로 스캔하는 것 같습니다. 용량이 작다는 점은 좋지만, 이건 좀 아닌 것 같아 더 고품질로 올려보았습니다. 최고수준인 엑설런트로 해야 예전 스캔대행업체들이 하는 수준과 비슷해지는 것 같더군요. 하지만, 이 설정은 스캔속도가 너무 떨어집니다. 그래서 어쩔 수 없이 한 단계 아래인 슈퍼파인으로 결정했습니다. 제법 봐줄만 합니다.

 

두번째로 손을 댄 설정은 "이미지 방향을 자동으로 보정합니다"를 해제했습니다. 이것을 해제한 이유는 가끔 틀리기 때문입니다. 전부 다 틀리면 모를까 한두 개 틀리면 더 짜증납니다. 그림이 많거나 큰 제목만 적혀 있는 페이지 부분이 가끔 틀리는 부분입니다. 그래서 이 옵션을 해제하고 대신 처음부터 정확한 방향으로 종이를 넣기로 했습니다. 먼저 스캔되는 면이 아래로 가고, 글의 윗부분이 먼저 들어가도록 삽입해야 합니다. 전부다 거꾸로 되어 있으면 나중에 한꺼번에 다 뒤집어주면 되지 않을까 생각했습니다만, 그러니까 OCR부분에서 문제가 생기더군요. 은근히 까탈스럽습니다.

 

다음으로 "현재 스캔이 종료된 후에도 스캐닝을 계속합니다" 옵션을 체크해 줍니다. 이 스캐너는 스펙 상 한번에 50장의 종이가 들어갑니다. 그러니까 200쪽 책을 한권 스캔하려면 양면스캔을 한다고 해도 최소 2번에 걸쳐 나눠넣어야 합니다. 그래서 연속적으로 이어지도록 이 옵션을 체크합니다.

 

 

 

첫번째 그림에서 "옵션"을 클릭하면 나오는 화면입니다. 여기서 "문서에서 문자만 선명하게 합니다" 옵션을 체크했습니다. 해보니 이게 나은 것 같아서 했습니다. 이 옵션은 취향의 문제입니다. 그리고 "비뚤어진 문자열을 자동으로 보정합니다"도 체크했습니다. 이것을 할 때와 안할 때의 차이를 직접적으로 경험하지는 못했습니다만, 그래도 하면 좀 낫지 않을까 싶어 했습니다.

 

[추가] "비뚤어진 문자열을 자동으로 보정"하는 설정을 적용할 때 문제가 생기는 부분이 있습니다. 문장이 일부러 사선으로 배열된 경우입니다. 큰 장을 시작하는 페이지에서 간혹 장 제목에 장식을 주어 글을 비스듬히 배열한 페이지가 있었는데, 글자들이 수평에 맞게 이 페이지를 자동으로 회전시켜 버리더군요. 이 설정도 상황에 맞게 적절히 사용해야 할 듯 합니다. [추가끝]

 

"스캔되는 면이 위로 오도록 올려 놓습니다"는 스캔되는 순서를 바꾸는 부분인데, 여러번 나눠서 스캔하다보니 바꾸지 않고 아래부터 스캔되는 것이 더 직관적인 것 같습니다.

 

참고로, "블리드 스루를 줄입니다" 옵션은 스캔할 때 뒷면 내용이 비쳐서 스캔되는 경우에 체크하는 옵션인데 저는 아직까지 별 문제가 없어서 사용하지 않았습니다. 어떤 책에 따라서는 필요할 수도 있겠습니다.

 

 

 

압축 부분입니다. "칼라 또는 회색톤 이미지에만" 적용되는 옵션이라고 명시되어 있습니다. 페이지 전체가 검은 글씨만 있다면 스캐너는 그 부분을 흑백으로 인식하고 스캔합니다. 그 경우는 이 옵션과 아무런 상관이 없습니다. 그림이 있는 페이지에 보통 적용됩니다. 기본값은 중간인 3입니다. 그런데 저는 가장 압축을 안하는 1로 바꾸었습니다. 이 경우, 용량이 늘어나긴 하는데 그 정도가 충분히 감당할 수 있다고 생각했기 때문입니다. 이 부분은 사람들마다 선호하는 것이 다를 수 있습니다.

 

그래서 압축수준을 1, 2, 3인 경우를 한 페이지짜리 샘플로 만들어봤습니다.(기본값은 3) 직접 품질과 용량을 보고 판단하시면 됩니다. 글씨뿐만 아니라 그림부분을 잘 비교해 보세요. 용량을 계산할 때 이 샘플의 용량 곱하기 페이지수 이렇게 계산하면 안됩니다. 앞서 말했듯이, 이것은 그림이 있는 페이지의 경우고, 그림없는 페이지는 흑백으로 처리되서 용량이 훨씬 작습니다. 그림이 많거나 컬러책은 당연히 용량이 훨씬 더 크겠죠.

 

압축1.pdf
다운로드

 

압축2.pdf
다운로드

 

압축3.pdf
다운로드

 

 

 

저장하는 파일형식은 pdf와 jpg가 가능합니다만, 당연히 pdf로 저장합니다. OCR선택은 당연히 "검색 가능한 PDF로 변환"을 체크해 줍니다. 전자문서로 바꾸는 가장 큰 이유가 바로 이것이죠. 그리고 OCR옵션은 한국어, 전체 페이지로 합니다. 만약 영문책을 스캔한다면 그때는 언어 옵션을 바꿔줘야 할 겁니다. 그런데 한국어로 설정하고 한국어책을 스캔했지만, 그 책 안에 있는 영어 단어를 검색해보니 잘 찾아주긴 하더군요.

 

참고로, OCR를 100%신뢰할 수는 없습니다. 가끔 틀리는 단어도 있고, 인식 못하는 단어들도 있었습니다. 특히 진하고 두껍게 쓰여진 글씨를 많이 틀리더군요. 예를 들어 "굉장하다"를 "밍장하다"로 잘못 인식한 경우가 있었습니다. "굉"자가 두껍게 쓰여있어서 ㄱ과 ㅗ가 붙어 있는 것처럼 인식했나 봅니다. 하지만 거의 대부분 단어를 정확하게 인식하니 검색하는 것 자체는 큰 어려움이 없어 보입니다.

댓글