Форум: общение без ограничения Форум: общение без ограничения
Форум сайта MirKnig.su
Пишите, общайтесь, задавайте вопросы.
 Поиск    Участники
Сегодня: 28.03.2024 - 19:50:00
   Форум: общение без ограничения -> Курилка -> Сканирование и обработка книг
Страницы:  1  2  3  4  5  
АвторСообщение

kamenkapenza

участник форума



Статистика:
Тем создано: 7
Сообщений: 65
Репутация: 70 ±
Предупреждения: 0
Хотелось бы научиться качественно делать электронные книги, но пока моему уму это недоступно))) В интернете много всяких инструкций, но хотелось бы поучиться у практиков, которые сами делают книги в форматах pdf/djvu. Может, кто-то поделится секретами мастерства?
--------------------------------------------------
Вячеслав
Сообщение # 1 Отправлено: 21.04.2016 в 23:29:48         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
Ну, это тема на несколько больших статей.))
Вообще, всё начинается с выбора сканера. Я сейчас пользуюсь сканером Epson V37. И это уже третий у меня такой модели (у меня сканеры "живут" в среднем год, ну, полтора...). До V37 был 1 V33, но, в общем, это одна и та же модель. До Эпсонов я работал исключительно с Хьюлетами, но после того, как сгорела матрица у очередного, я перешел на Эпсон и не жалею - софт да и цветопередача у них лучше (у соотносимых моделей). Я так же работал со сканами от Canon, не своими, и, честно сказать, считаю матрицы Кэнона лучшими по цветопередаче! Но софт у них совершенно примитивный, даже у "навороченных" моделей, увы. Можно, разумеется, работать с внешними программами для сканирования, но, учитывая то, что каждый скан я потом всё равно обрабатываю в Фотошопе, смысла осваивать дополнительный софт я не вижу...
Итак, когда выбор сканера сделан и он приобретен, нужно изучить его возможности. Дело в том, что у "продвинутых" сканеров (опять же буду говорить о Epson) есть не только "стандартный" режим сканирования, но и "профессиональный", с множеством настроек, как типовых, так и по выбору пользователя.
Самое первое, что делаем при предварительном просмотре сканирования, это устанавливаем "рамку", т.е, размер поля сканирования. Обычно сканируемый лист (страница) меньше полно поля стекла сканера. Книги формата А5, например. На моём V37 установленная рамка потом при каждом следующем скане будет остваться такого же размера, просто при смене страницы её нужно будет сдвигать по полю скана, чтобы совместить с границами страницы. Сменить размер "рамки" можно вручную, простым "движком-ползунком".
Затем стоит учесть, какой скан мы делаем - в сером режиме или в цветном. Страницы с исключительно текстом да и с "ч/б" фотографиями намой взгляд лучше сканировать в сером режиме. (Кстати добавлю здесь, что сканы в сером режиме, например 8-ми или 16-битовом проще и качественней обрабатываются в "шопе"). Если же на странице есть цветные элементы - фото, картинки, издательские "украшения" по типу линий, вставок, виньеток, номеров страниц в цвете и т.п., то такие страницы, разумеется, сканируем в цветном режиме.
Второе и очень важное: в проф. настройках сканера (Эпсон и Хьюлет) присутствуют настройки яркости / контрастности скана. Они управляются движками на шкалах, и сразу наглядно отображаются изменения в этих категориях в окне предпросмотра. Тут сложно что либо советовать именно по степени применения этих настроек, ведь у каждой книги своя специфика. Да и мониторы тоже у всех разные. (Применительно к этому моменту могу уж совсем безкомпромиссно рекомендовать хороший монитор, желательно калиброванный профессионально.)))
Основная задача этого этапа сканированя, это убрать в окне предварительного просмотра всякие графические артефакты - фон в первую очередь. Даже в книгах с мелованной бумагой фон будет неизбежно - хотя бы от "просвечивания" оборотной стороны страницы, текста и изображений там. Старые же книги, пожелтевшие от времени, при сканировании в автоматичесчком режиме выглядят совсем уж... характерно.))) С серым сплошным фоном по странице или с цветным пятнами этого же фона в режиме "цвет". Но вы и сами видели такие сканы. Увы, они появляются и сейчас, хотя такого "шлака" стало значительно, на порядки даже, меньше, чем в конце 90-х или в конце 2000-х годов, всё-таки у людей выросли требования к качеству электронных версий книг...
Сообщение # 2 Отправлено: 22.04.2016 в 15:58:41         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
Выбор разрешения скана (пикселы на дюйм, они же dpi / дпи). Я практически, за очень редкими исключениями, всё сканирую в режиме 300 дпи. Этого разрешения достаточно даже для принтера, ну, разумеется, если не говорить о чертежах или, например, выкройках бумажных моделей, где желательно делать сканы в 600 дпи. Но нужно учитывать, что размер ("вес") скана напрямую зависит от дпи, поэтому нужно выбирать разумный компромисс размера/качества. В электронных вариантах книг и журналов, предназначенных в большинстве случаев для просмотра на компьютерах, качество 300 дпи давно (и заслуженно) считается вполне достаточным.
Сообщение # 3 Отправлено: 22.04.2016 в 16:07:33         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
Это вот, в общем, основные моменты по самому сканированию, если какие-либо вопросы возникнут в процессе, можно их будет задать здесь же.
Дальше, если эта тема станет интересной, можно будет продолжить разговор об обработке сканов.))
Сообщение # 4 Отправлено: 22.04.2016 в 16:10:34         Цитировать сообщение

kamenkapenza

участник форума



Статистика:
Тем создано: 7
Сообщений: 65
Репутация: 70 ±
Предупреждения: 0
Спасибо за полный, развернутый ответ! У меня сканер Canon 8800, пока работает, так как я им практически ничего не делал. Как вы сканируете книгу: постранично или разворотом?
--------------------------------------------------
Вячеслав
Сообщение # 5 Отправлено: 22.04.2016 в 21:06:39         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
Это зависит от самой книги и нескольких обстоятельств. Во-первых, если размер стекла сканера А4 и книги соотносимый... ну, скажем, от 240 мм по стороне страницы, то, разумеется, постранично. Если книга формата А5, то можно и разворотом. Но и тут есть нюансы - при сканировании разворотом неизбежны всякие "неприятности" типа перекоса одной из страниц разворота и т.п. Есть, разумеется, специальные программы, которыми потом можно нивелировать всё это, позже я упомяну о них. Но вообще, по-моему, лучше делать постраничные сканы, а уже потом "сшивать" в Фотошопе развороты, если они есть в книге и если это имеет смысл.
Да и ещё у Эпсонов есть функция "доворота" страницы, то есть, если страница ложится чуть криво на стекло сканера, то программа сканирования Эпсона её выравнивает сама. Этого не получится при сканировании разворотом.
Сообщение # 6 Отправлено: 22.04.2016 в 22:38:57         Цитировать сообщение

kamenkapenza

участник форума



Статистика:
Тем создано: 7
Сообщений: 65
Репутация: 70 ±
Предупреждения: 0
Спасибо, уважаемый Gerza! На выходе всегда должен быть несжатый tif?
--------------------------------------------------
Вячеслав
Сообщение # 7 Отправлено: 23.04.2016 в 00:02:32         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
Нет, не TIFF! При сканировании выставляйте формат выхода JPG (JPEG). Дело в том, что хотя jpeg в режиме сжатия уступает, конечно же, растровому tiff в режиме сжатия при сканировании (результате) некоторых специфических изображений, например, чертежей - но тем не менее jpeg в силу своей структуры более лучше подходит для последующей с ними работы в графических редакторах. Потому, кстати, он и получил такое распространение.
Кстати, при окончательной сборке PDF-файла большинство программ-сборщиков PDF всё равно проведут внутреннее конвертирование любых графически форматов в TIFF, являющимся базовым для структуры PDF - так в своё время установили в ADOBE при разработке архитектуры ими текстово-графического формата PDF.
Одно время... в конце 90-х, сложился в сканировании технической литературы "стандарт" сканирования чертежей и схем в формате TIFF, да ещё в битовом, ч/б, режиме. Вы, я думаю, видели такие сканы. Но сейчас это "правило" уже в прошлом, в силу своей совершенной надуманности.))
Сообщение # 8 Отправлено: 23.04.2016 в 00:14:31         Цитировать сообщение

Gerza

участник форума



Статистика:
Тем создано: 1
Сообщений: 44
Репутация: 49 ±
Предупреждения: 0
В качестве иллюстрации к вышесказанному предлагаю посмотреть 3 скана.
Первый, сканирование в автоматическом режиме:

http://i80.fastpic.ru/big/2016/0423/15/f4fc371d58e988b8db8280cb81a1ff15.jpg

Второй, с использованием настроек сканера яркость/контраст:

http://i77.fastpic.ru/big/2016/0423/13/d0aa2f54f1b2abb58e1f945de9110c13.jpg

И третий, окончательный вариант, после обработки скана в Фотошопе:

http://i79.fastpic.ru/big/2016/0423/a1/49b8f59a8b1a42d44caf3a1e626314a1.jpg
Сообщение # 9 Отправлено: 23.04.2016 в 00:36:00         Цитировать сообщение

4u4undr

участник форума



Статистика:
Тем создано: 1
Сообщений: 29
Репутация: 34 ±
Предупреждения: 0
Для ч/б книг, которых большинство:
1. Сканирование в 300 дпи в градациях серого, как правило разворотами (сразу обе страницы), перекосы и смещения относительно поля сканирования по барабану, одно желательно, лучше прижимать середину, чтобы минимизировать геометрические искажения у корешка. Сканировать в тифы, никаких джипегов. Сканер желательно не CIS, с нормальной глубиной резкости, и побыстрее, остальное не важно.
2. Запихивается в сканкромсатор.
3. Кодируется в дежавю и/или пдф. В дежавю добавляется слой распознанного текста.
4. Выкладывается в сеть.
Сообщение # 10 Отправлено: 23.04.2016 в 11:35:58         Цитировать сообщение
Страницы:  1  2  3  4  5  
Администратор запретил отвечать гостям на сообщения! Для регистрации пройдите по ссылке: зарегистрироваться


Powered by WR-Forum Professional © 1.9.3 MS