Новая система обработки изображений захватывает текст из едва открытых книг

 

Рочестерский текстолог Грегори Хейворт руководил разработкой метода оцифровки книг с хрупким переплетом.

«Где манит опасность» пытается привлечь потенциальных читателей своей обложкой, на которой изображен мужчина (чья нога привязана к каркасу кровати) бьет другого мужчину (предположительно, его похитителя) по лицу. Книга представляет собой яркий пример одного из романов стоимостью более 10 000 центов, находящихся в ведении Департамента редких книг, специальных коллекций и сохранности (RBSCP) Университета Рочестера.

Новая система обработки изображений захватывает текст из едва открытых книг

Член команды Lazarus Project Кен Бойдстон, генеральный директор Megavision, корректирует монументальный роман Николаса Картера «Где манит опасность» в сотрудничестве с директором проекта Lazarus Грегори Хейвортом, доцентом английского языка в Рочестере. Команда использует принцип Шаймпфлюга и мультиспектральную визуализацию для безопасной оцифровки содержимого хрупкой книги и других подобных книг. Предоставлено: фото Рочестерского университета / Дж. Адам Фенстер.

Даймовые романы – это разновидность американской литературы среднего уровня, появившаяся в 1860-х годах. Выпускаемые еженедельно, они дают большое представление о том, какие темы были популярны среди читателей, особенно молодых людей, в то время. Проблема в том, что большая часть коллекции RBSCP чрезвычайно хрупка и сложна в использовании. И это не уникально для Рочестера.

«Редко бывает, чтобы они выжили и собрали так много в одном месте», – говорит Отэм Хааг, помощник директора RBSCP из коллекции Рочестера. «Они были напечатаны на самой дешевой бумаге».

Из-за некачественной бумаги копии, уцелевшие за последние сто с лишним лет, стали настолько хрупкими, что открыть их – значит разорвать на части. Эта хрупкость сделала их идеальными подопытными для беспрецедентной системы визуализации.

Во главе с Грегори Хейвортом из Рочестера, доцентом кафедры английского языка и текстологии, команда проекта Lazarus разработала новый метод создания цифровых изображений рукописей и столь же редких и хрупких книг, не открывая их более чем на 30 градусов.

Зачем заморачиваться с привязкой?

«Есть целые коллекции, которые никогда не изучались должным образом просто потому, что книги в них невозможно открыть», – говорит Хейворт. «Их, конечно, можно было открыть, сфотографировать и уничтожить. Большинство библиотек не хотят этого делать ».

Почему нет? Что может помешать библиотеке разобрать рукопись, а затем переплести ее? Несколько веков.

Прочитайте также  Почему ледниковые циклы усилились миллион лет назад? Подсказки на дне Атлантического океана - найдены!

Новая система обработки изображений захватывает текст из едва открытых книг

«Где манит опасность» Николаса Картера – один из 10 000 с лишним десятицентовых романов, хранящихся в отделе редких книг, специальных коллекций и сохранности Университета Рочестера. Предоставлено: Университет Рочестера.

Средневековые рукописи – обычное дело для Анны Зибах-Ларсен, директора библиотеки Росселла Хоупа Роббинса в Рочестере. Неоднократно она приобретала рукопись, переплетенную так туго, что ее с трудом можно было открыть. В этих случаях рукопись относилась к средневековью, а переплет – к 20 веку, что позволило ей отправить книгу в лабораторию по консервации для восстановления. Однако, если бы в тех же рукописях были средневековые переплеты или даже переплеты 16-го века, были бы приложены все усилия, чтобы не только сохранить их нетронутыми, но и сохранить переплет.

«Рукопись – это не только ее текст или страницы», – говорит Зибах-Ларсен. «Вся книга – ценный и важный объект изучения, особенно если переплет оригинальный. И это не только для медиевистов. Есть много ученых, которые так же ценят современные книги ».

 

Подобно тому, как кто-то может изучать архитектуру Сикстинской капеллы в дополнение к фрескам, украшающим ее потолок, некоторых исследователей может заинтересовать физический состав рукописи, включая структуру и используемые материалы, а также то, кто их создал.

Система из двух частей для сохранения и восстановления

Простой подход «наведи и снимай» не даст четких, разборчивых изображений из едва открытой книги. Вот почему Хейворт призвал членов команды Lazarus Project Кена Бойдстона, генерального директора Megavision, ученого-визуалиста Кейта Нокса (70 лет, 75 лет (доктор философии)) и менеджера проекта Дейла Стюарта (70 лет), чтобы те помогли ему создать систему визуализации.

«Проблема при фотографировании объекта, который открывается только на 30 градусов, заключается в том, что глубина резкости очень мала», – говорит Хейворт.

«Другими словами, верхняя часть находится в фокусе, а нижняя – нет».

В повседневной фотографии объектив и сенсор камеры (плоскость пленки) параллельны. Плоские объекты, сфотографированные параллельно объективу и датчику, будут резкими. Выведите группу из параллели или сфотографируйте неровный объект, и объект будет резким только там, где он пересекает плоскость фокуса. Вот почему лицо человека на фотографии будет резким, а уши – размытыми.

Прочитайте также  Квантовые точки перестают мигать

Чтобы сфокусировать целую страницу частично открытой книги, требовалась нетрадиционная фотография. Объектив должен был быть под другим углом, чем датчик. Это визуализация по Шаймпфлюгу.

Чтобы техника работала, команда использует камеру обзора, которая имеет секцию сильфона, напоминающую гармошку, которую можно поворачивать. (Представьте, что вы делаете снимок с помощью S-образной камеры.) Фотографируемую книгу удерживает открытая подставка, которая защищает ее от раскрытия более чем на 30 градусов. Затем делается фотография сверху, создавая искаженное, но сфокусированное изображение одной из страниц книги. Затем они исправляют геометрию изображения, делая его прямоугольником вместо ромба, используя уникальное программное обеспечение, разработанное Knox. Когда процесс будет завершен, страницу можно будет читать так, как если бы книга лежала ровно.

Новая система обработки изображений захватывает текст из едва открытых книг

Роман проходит мультиспектральное сканирование. Предоставлено: фото Рочестерского университета / Дж. Адам Фенстер.

Вторая часть системы – многоспектральная съемка. Пожелтевшая бумага или пятна могут затруднить чтение страниц независимо от того, насколько открыта книга. Улавливая несколько длин волн света, эта техника улавливает то, что человеческий глаз не может при коррекции цвета.

Обнаружение «скрытого» текста – это основная задача проекта Lazarus. С 2009 года группа ученых, ученых и отраслевых экспертов восстанавливает поврежденные объекты культурного наследия, такие как рукописи, а также карты, картины и древние артефакты.

Новая система визуализации стала результатом полуторагодичной работы при поддержке гранта Национального центра технологий сохранения и обучения. После успеха «генеральной репетиции» команда будет работать над повышением эффективности коммерческого использования.

«Я думаю, что произойдет то, что библиотеки, которые примут эту технологию, действительно откроют определенный период времени для читателей и ученых», – говорит Хейворт.

В Рочестере мелкие романы могут стать одним из таких ворот для ученых, заинтересованных в изучении доминирующих взглядов, верований и ценностей в период с конца 19-го по начало 20-го веков.

 

В нашем Telegram‑канале вы найдёте новости о непознанном, НЛО, мистике, научных открытиях, неизвестных исторических фактах. Подписывайтесь, чтобы ничего не пропустить.
Поделитесь в вашей соцсети👇

Похожие статьи


ДРУГИЕ НОВОСТИ
 

 

Добавить комментарий