Мегаобучалка Главная | О нас | Обратная связь


Тема: . Сканирование и оцифровка печатных и графических текстов



2016-09-17 430 Обсуждений (0)
Тема: . Сканирование и оцифровка печатных и графических текстов 0.00 из 5.00 0 оценок




Цель: изучить технологию сканирования и оцифровки текстов

Время: 4 часа

Вопросы:

6. Конверсия печатного материала в электронный формат

7. Изготовление цифровых фото- или аудио-, видеодокументов

8. Оцифровка микрофильмов.

9. Сжатие данных (компрессия) и форматы оцифровки.

10. Оптическое распознавание букв.

 

Методика выполнения:

Конверсия печатного материала в электронный формат

Существует несколько синонимов для обозначения этого процесса: оцифровывание, оцифровка и даже по терминологии, принятой у связистов, — цифровизация. В английской литературе также используются два схожих термина и четыре способа их написания — digitization, digitizing, digitisation, digitising. Оцифровка чаше всего осуществляется путем сканирования печатных или рукописных материалов.

Изготовление цифровых фото- или аудио-, видеодокументов

Изготовление цифровых фото- или аудио-, видеодокументов осуществляется с помощью цифровых фотоаппаратов, видеокамер, других оптико-электронных технических средств. Этот процесс быстро находит массу приверженцев и, по сути, очень близок к сканированию: изображение разбивается на небольшие участки (пиксели), яркость и цвет которых фиксируется. Типичное число пикселей в современных аппаратах — несколько миллионов (от 1 до 7—8 млн пикселей на кадр). Сменное устройство памяти (memory stick) или память типа «flash» позволяет записать от 100 до нескольких тысяч кадров, которые впоследствии можно перенести на компьютер, обработать, послать по электронной почте друзьям или распечатать на принтере.

Обмен или предоставление своих услуг по публикации гостевых материалов. Этот процесс в чем-то близок к традиционному межбиблиотечному абонементу (МБА) или книгообмену.

Автоматическое производство переведенных с других языков материалов. Это очень интересная и перспективная отрасль автоматической обработки текстов. Фактически осуществляется многократная переработка печатного текста: конверсия в машиночитаемую форму, оптическое распознавание символов и автоматизированный перевод содержания.

Рассмотрим этот процесс подробнее.

Оптико-механическое считывающее устройство с точной фокусировкой начинает проходить над листом по горизонтальной строчке, останавливаясь для замеров по заранее заданной программе. При остановке измеряется коэффициент отражения данного маленького участка (пикселя): если задано считывание черно-белого материала, то это просто двоичный режим, при котором фиксируется черное/белое (или да/нет, или единица/ноль). При учете градации серого цвета или при сканировании цветных изображений фиксируются более сложные параметры. Шаг сканера между остановками для замеров называется пространственным разрешением. Завершив просмотр строчки, считывающая головка возвращается к началу строки, сдвигается на небольшой промежуток вниз, и процесс повторяется до конца листа. Интервал перемещения вниз также определяет величину пространственного разрешения. Количественно величина пространственного разрешения выражается в числе остановок (точек) на дюйм (dots per inch, dpi). Достаточно широко применяются 200, 300. 400... 1200 dpi, а в некоторых случаях используются различные параметры пространственного разрешения по горизонтали и по вертикали, и тогда запись выглядит, допустим, 600 х 1200 dpi. Если вспомнить, что дюйм — это 2,54 см, то типовое разрешение в 300 dpi означает пространственное разрешение лучше, чем 1/10 миллиметра.

В зависимости от назначения, требующейся производительности и приемлемой цены используются различные типы сканеров:

• планшетные сканеры для листа размером А4 — пожалуй, самые простые и недорогие (100—300 долларов), работают с единичным листовым материалом. В более сложных моделях используется автоподача листов, что в 2—3 раза увеличивает стоимость сканера;

• барабанные сканеры, которые удобнее для работы с большим количеством листового материала;

• планетарные сканеры предназначены для работы с переплетенными документами; специальное устройство (колыбель). в котором книга лежит не полностью открытой, позволяет обеспечивать сохранность редких изданий. Возникающая при этом кривизна поверхности книжного листа компенсируется специальной программой; при необходимости можно также «очищать» программными средствами отсканированное изображение от случайных загрязнений, имеющихся на оригинале. Другие меры по обеспечению сохранности печатного материала и защите оператора при сканировании состоят в компьютерном контроле уровня освещенности поверхности документа. Подобные сканеры, как правило, стоят 20—35 тыс. долларов;

• последнее время получили распространение большие сканеры со считывающей головкой, перемещающейся плоскопараллельно над документным столом; такие устройства хороши для сканирования карт, чертежей и других документов большого формата. Стоимость таких устройств вместе с программным обеспечением обработки изображений составляет около 30—45 тыс. долларов.

Задание №1

Изучить конструктивную схему книжных сканеров и их технические характеристики. Создать презентацию на тему «Книжные сканеры: устройство и технические характеристики».



2016-09-17 430 Обсуждений (0)
Тема: . Сканирование и оцифровка печатных и графических текстов 0.00 из 5.00 0 оценок









Обсуждение в статье: Тема: . Сканирование и оцифровка печатных и графических текстов

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (430)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.006 сек.)