RuLib

Новости Главная Каталог книг Статьи Загрузка Карта сайта

 

Оцифровка бумажных документов.

   Оговоримся сразу нас, будет интересовать быстрая оцифровка книг и журналов в домашних условиях. Существует два основных способа сделать это: купить готовое устройство (планшетный книжный сканер) или купить полуфабрикаты, приложить немного усилий (умственных и физических) и получить некое подобие профессиональных решений.

Планшетный книжный сканер.

Рис. Сканер книжный OpticBook 3600 (http://www.plustek.ru/)

 

  К достоинствам планшетных сканеров относят:

Высокое качество цветопередачи.
Высокая разрешающая способность.
Отсутствие искажений для плоских и плотно прижатых документов.

   Недостатки вытекают из достоинств, т.к. для получения изображения используется CCD (Charge Coupled Device) или CIS (Contact Image Sensor). Это, линейка свето-чувствительных сенсоров, которую механическим способом необходимо протягивать вдоль оригинала.


Рис. Линейный датчик: маленький, компактный, дешевый. Используется в планшетных сканерах.


Рис. Полноформатный датчик. Это матрица светочувствительных элементов. Используется в цифровых фотоаппаратах.

Для указанного выше сканера OpticBook 3600 одна страница сканируется за 7 сек. для разрешения 300dpi в цвете без учета времени возврата каретки в исходное состояние. Размер области сканирования всего 216 на 297 мм (А4), цена более 8500 руб. на октябрь 2008г. Многовато будет, просто для того чтобы "медленно" сканировать книги. Другое дело цифровой фотоаппарат. Теперь его наличие дома просто необходимость. А раз нам все равно нужен фотоаппарат, то не попробовать ли нам сделать из него цифровой сканер книг? Правда тогда фотоаппарат должен обладать оптическим зумом, разрешением не мение 10 Мега пикселов и функцией макросъемки. Основное достоинство цифрового фотоаппарата - практически мгновенное сканирование (1-2 сек). Т.е. скорость оцифровки приблизительно равна максимальной скорости ручного перелистывания книги. Мечта однако! : ). Понимая перспективность такого способа сканирования, многие фирмы выпустили профессиональные решения на основе цифровых фотоаппаратов. Особое место среди них занимают сканеры Kirtas (http://www.kirtas.com). 2400 страниц в час умеют сканировать их APT BookScan 2400 Gold. Страницы переворачивает сам сканер с помощью "механической руки".

Рис. Центр сканирования фирмы Kirtas.



Рис. APT BookScan 2400 Gold. Ничего особенного! И стоит каких то 200 000 долларов : ).
 

   Шутка конечно! APT BookScan 2400 Gold это наш идеал, созданный Kirtas в содружестве с исследовательским центром Xerox PARC. Приведем краткие характеристики и особенности:

Скорость работы: 2400 снимков(стр.) в час
Варианты снимков: ч/б, оттенки серого, цвет
Листание страниц: автомат
Разрешение: 300-600 dpi
Две 16,6-Мп матрицы, 36 бит, RGB
Размер страниц: 11,5 x 18 см - 28 x 35,5 см
Толщина переплета: 10 см
Интерфейсы: FireWire, Ethernet
Размеры устройства: 64 x 76 x 122 см
Вес: 77 кг

    Теперь посчитаем сколько тратит время  APT BookScan 2400 Gold на сканирование одной страницы. 3600сек. разделить на 2400стр.  = 1.5 секунды на 1 страницу. Честно скажу, я могу листать книгу практически  с такой же скоростью, если она предварительно закреплена. Тогда вопрос: "За что же надо платить более 200000 долларов?" Ответ очевиден: за промышленное решение, и наличие такого ресурса как http://books.google.com/ , тому наглядное подтверждение.
     Из решений попроще, посмотрим на книжные сканеры фирмы Atiz  и Элар .

 

Рис. ATIZ BookSnap (цена более 213000 руб.)
 

Рис. ATIZ BookSnap с чехлом для защиты от засветки.
 

Рис. Сканер Элар Планскан серия А .
 

Рис. Элар ПланСкансерия С.(Средняя производительность по данным производителя 250-300 сканов в час)

Рис.Элар ПланСкан Репро.
 


     Сканеры ATIZ работать без прижимного стекла не могут, т.к. оно является выравнивающим. Именно благодаря выравнивающему V - образному стеклу и подвижной нижней книжной колыбели, происходит выравнивание листов и фиксация центра книги строго в одной и той же плоскости.


Рис. V-образное стекло поднято, страницы под действием внутреннего напряжения переплета книги деформированы.


Рис. V-образное стекло опущено, страницы плотно прижаты к стеклу и выпрямлены. Все же, хорошо заметно, что книга имеет еще возможность самопроизвольно перемещаться вдоль  V-образной книжной колыбели, когда стекло поднято и оператор перелистывает страницы.

 

Рис. V-образное стекло и нижняя подвижная колыбель заставляют находиться центр разворота книги  в одном и том же месте. Однако, в точке стыка двух стекол  есть небольшая "мертвая зона", изображение под которой будет утеряно.
 

    Сканеры от Элар могут работать и без стекла, но тогда чем они отличаются от штатива с закрепленным на нем цифровым фотоаппаратом? :) .


Рис. Штатив с цифровым фотоаппаратом.

   Отличие конечно существует, и существенное. У них высокая цена и есть книжная колыбель. А это очень важно для получения цифрового изображения книги с минимальными искажениями. Именно книжная колыбель и прижимное стекло обеспечивают условия, когда  обе страницы одного разворота книги будут находиться на одной геометрической плоскости. Конструкцию и принцип работы сканера ATIZ BookSnap в домашних условиях воспроизвести довольно сложно, а вот что-то типа планетарного сканера от Элара  с прижимным стеклом, вполне реально.
   Сформулируем основные задачи, которые должна решить конструкция нашего домашнего планетарного сканера:
     повторяемость, т.е. простота исполнения,
     надежная фиксация фотоаппарата,
     фиксация разворота книги в одной плоскости для уменьшения геометрических искажений,
     фиксация самой книги для уменьшения трудоемкости пост обработки,
     равномерность и стабильность освещения сканируемой поверхности,
     исключение бликов на прижимном стекле.
   Основной трудностью при реализации домашнего сканера будет разработка нашего  варианта книжной колыбели. Свою конструкцию я назвал "книжная кроватка". Это два листа фанеры, которые лежат на нижней полке на поролоновых подушках. Благодаря упругости поролона разворот книги будет достаточно плотно прижиматься к стеклу.

    Исходные материалы: Цифровой фотоаппарат Самсунг S1050 (10 МПиксел) - 5000 руб. март 2008г., флешь карта на 2ГБайта -450 руб., блок питания - 340 руб., 4 рейки по 37 руб., 30 металлических уголков по 4 руб., 6 патронов под лампы по 16 руб., крепеж винт+гайка 100 шт. по 70 коп., две петли по 10 руб., две губки по 30 руб., 4 проушины по 15 руб., кусок фанеры за 90 руб. Стекло, провода, сетевые вилки и ткань уже были в наличие. Из инструментов мне понадобились: дрель, электро-лобзик, отвертка.  Результат представлен ниже.
 

Рис. Наш "ПланСканХоум", собранный из реек и уголков. Полог из черной ткани обязателен для исключения бликов на прижимном стекле.

Рис. Обратите внимание на конструкцию "книжной кроватки". На нижней полке на поролоне  лежат две фанерки, которые благодаря поролоновым подушкам и прижимают книгу к стеклу.

Рис. Проушины нужны для исключения продольного и поперечного смещения.

Рис. Сзади на рейках весит полог из белой ткани и двумя основными источниками света.

Рис. Использую USB удлинитель для того что бы постоянно не втыкать кабель в фотоаппарат и ноутбук.

Рис. Кроватка для крепления фотоаппарата. Проволокой фиксирую USB кабель и провод от блока питания.

Рис. Фотоаппарат устойчиво закреплен, его плоскость можно выровнять подкладывая под углы кроватки полоски  бумаги или фольги.

Рис. Прижимное стекло опущено и разворот книги  выровнен в плоскости стекла. Поверхность "книжной кроватки" задекорирована черной матовой тканью (строго обязательно ).

Рис. Тонкая стальная пластина прижимает обложку книги к поверхности книжной кроватки, сама пластина фиксируется двумя полосками фанеры, прижатыми "щекой", затянутой болтом с винтом-барашком.

Рис. Боковое освещение носит вспомогательный характер. Обязательно используйте однотипные источники света. Выбирайте правильно или настраивайте баланс белого.

Рис. Такая конструкция "книжной кроватки" без труда справляется с книгами толщиной до 3 см. (со сменой толщины поролоновых подушек до 6 см).

  Перед сканированием книга должна быть выровнена и жестко зафиксирована. Это очень важно! Фиксация книги и ее выравнивание позволяют избавится или свести к миниму очень трудоемкие операции пост обработки. Кусочком сухого мыла, нанес на черную ткань "книжной кроватки" реперные метки для книг примерно одного формата. Такие метки позволяют визуально контролировать положение книги. Когда сканирование доходит до половины толщины книги, крепление книги переношу с правой половины "книжной кроватки" на левую. Само сканирование идет очень быстро: правой рукой приподнимаю стекло, левой переворачиваю страницу, правую руку со стеклом опускаю, а в это время поднимаю левую и нажимаю на фотоаппарате кнопку спуска. 3-4 сек. вполне хватает на разворот. Правда, через несколько часов начинаешь ощущать себя роботом. :) . Средняя производительность зависит от многих факторов, однако более 350 сканов в час (700 страниц в час) вместе с операциями закрепления книги и переноса сканов из фотоаппарата в компьютер не получается.

  Для обрезки не нужных краев сканов разворота книги,  использую популярный СканКромсатор вер. 5.9. Потом с помощью Lizardtech Document Express Enterprise графические файлы кодирую в формат djvu. Опции кодирования выбираю в зависимости от содержания иллюстративного материала книги. DjvuOCR 2.4 и ABBYYR FineReader Версии 9.0 использую для  получения и внедрения OCR слоя в книгу. Обзор  djvu программ хорошо представлен здесь http://www.djvu-soft.narod.ru/ .

Итоги.

   10 Мега пикселов моего фотоаппарата маловато для сканирования книг большого формата. К сожалению нельзя точно сказать, сколько мега пикселов необходимо. Все зависит от связки оптика + матрица. По моим оценкам надо от 18 до 32 Мп., " что бы на все случаи жизни хватило". Книги малого и среднего формата, которые не содержат фотографических иллюстраций и сохраняются только в черно-белом варианте, получаются хорошо. Главное не надо слишком сильно приближать изображение книги к краям кадра. На краях обязательно появятся искажения. Лучше использовать не всю матрицу и понизить  разрешение, чем получить искажения на краях. Если книга или журнал имеет глянцевую поверхность, придется организовывать рассеянное  диффузное освещение. Опыт показал что неплохих результатов можно добиться, если использовать обычные тонкие  белые полиэтиленовые пакеты без рисунка. Разрежем их и повесим между книгой и источниками света. "Пакеты должны как бы сами начать светиться всей своей поверхностью". Главное постараться размыть точечные источники света! Интересно, как эта проблема решена в сканерах APT BookScan 2400 Gold. Хорошо видно, что у них два мощных источника света по бокам и малейшее искривление листа глянцевой бумаги будет давать блики на линии изгиба.


Сканер использует два мощных направленных источника света. Скорее всего он не сможет качественно сканировать книгу  с "бликующей"  глянцевой бумагой (?).

Оператор внимательно наблюдает за ходом и результатом сканирования. Это значит, что полной автоматизации процесса сканирования добиться не удалось, иначе один бы человек ходил между сканерами и "заправлял их книгами".

   Не до конца для меня остался решенным  вопрос с удобным и надежным закреплением книги. Самым перспективным считаю использование "лип". На левую и правую части книжной кроватки надо приклеить (пришить) полоски из одной половинки "липы", так что бы они образовали сплошной коврик. Для книг с твердым переплетом из ткани сшить "безразмерную обложку", где с обратной стороны приклеить или пришить вторую половину "лип". Для книг с мягким переплетом  в нашу "безразмерную обложку" с липами надо будет вставлять твердый листок картона. Буду пробовать ! Пожалуй самая большая ошибка допущенная мной в конструкции моего ПланСканХоум-а это не возможность быстрой его сборки и разборки. Хотя все соединения на болтах, общее время разборки и сборки более 50 мин.

 Дополнительный материал.(источник)

  Интересен эксперимент некого японского студента, который из сканера и конструктора лего собрал "полностью автоматический книжный сканер"


Рис. Японский чудо сканер. Если посмотреть видео, то станет понятно, что это не более чем шутка, хотя некоторые интересные решения в этой конструкции есть!.

 

  Еще одно чудо пытливой мысли это Scantastic 3000b.

Так сказать "автоматизация на коленке".

    Громоздкая, но в отличие от японской, вполне работоспособная конструкция. Использован блок для подъема закрепленного сканера с помощью импровизированной педали. Автомобильный амортизатор используется, что бы сканер не плюхался на книгу. Использованы два шарика, на которые давит оператор ускоряя движения сканера вниз и контролируя плавность хода. Правда, за раз сканируется не разворот книги, а  одна страница. Основной недостаток обеих конструкций это наличие в них большого количества движущихся частей с большими амплитудами, книги надежно не закреплены. У японца на видео хорошо заметно, что разворот книги плотно не прилегает к стеклу сканера.


Лампа сканера хорошо высвечивает реальную кривизну разворота книги.


Лист переворачивается путем протаскивания по поверхности "грузика". Интересно сколько надо было сделать дублей, что бы снять "это" на видео  :) .

  Понятно, что сверх задача "автоматическое перелистывание" на коленке не решить. Нужны сложные кинематические схемы с большим количеством всевозможных датчиков. Однако японец подарил хорошую идею. В его конструкции книга двигается только вверх - вниз и этого вполне будет достаточно для полуавтоматического сканирования!  На рисунке я изобразил примерную кинематическую схему полуавтоматического устройства прижима книги к стеклу или к сканеру.


Рис. Простейшая кинематическая схема автоматизированного прижима книги.

  Человеку остается только быстро листать и нажимать кнопку прижима. Конкретная реализация зависит от наличия полуфабрикатов. Лучше найти готовый промышленно изготовленный узел и использовать его в своей конструкции. Для начала можно поставить сбоку обычный рычаг, как это было в старых ручных печатных станках или пользоваться педалью как у Scantastic 3000b. (Перевернул страницу, нажал на педаль, нажал на спуск цифрового фотоаппарат, отпустил педаль). В своей кинематической схеме я изобразил рычаг вертикально, но его можно расположить плашмя, вместо блоков использовать тонкие пластиковые трубки, вместо соленоида, ручной велосипедный тормоз и т.д. и т. п.  Если вы можете позволить себе 2 фотоаппарата, то лучше использовать V - образное прижимное стекло, как в сканере из интернет архива Сан-Франциско.


Рис. V - образное прижимное стекло поднимается и опускается ножной педалью.

  Единственный недостаток такой конструкции это сложность изготовления в домашних условиях.


Внимание статья не окончена! (сентябрь-октябрь 2008г.)

 

Новости Главная

Каталог книг

Статьи

Загрузка Карта сайта
Сайт управляется системой uCoz