Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
aldan RE:Подайте бедному копеечку на книжку с литреса... 17 часов
Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 дня sem14 RE:Серия "Символы времени" издательства "Аграф" 6 дней Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 неделя tvv RE:faq brainstorm =) 1 неделя Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 неделя Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 2 недели sem14 RE:За иллюминатором (серия) - чего не хватает? 2 недели sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 недели Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 3 недели larin RE:Пропал абонемент 4 недели tvv RE:DNS 4 недели MrMansur RE:<НРЗБ> 1 месяц Stager RE:Беженцы с Флибусты 1 месяц Tramell RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц Впечатления о книгах
Oleg68 про Кристенсен: Полубрат [Halvbroren ru] (Современная проза)
31 01 Долго читал. Неоднозначная книга. С одной стороны,- интересная, С другой,- как- то рывками. Оценка: хорошо
udrees про Леруа: Мутанты: О генетической изменчивости и человеческом теле [Mutants: On Genetic Variety and the Human Body ru] (Биология)
31 01 Отличная книга, написанная как можно более доступным языком про генетику, язык генов и как мутации в них влияют на человека. Приводится все это на примерах достаточно известных мутаций – сросшиеся близнецы, волосатые люди, ……… Оценка: отлично!
udrees про Атаманов: Первая зима [СИ] (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
31 01 Хорошо написано в жанре литРПГ, хорошее продолжение. Герой и его альянс продолжают свое развитие в новом мире. Нюансом является то, что есть боги-валлары, которые вмешиваются в игровой процесс, собственно так его они и именуют. ……… Оценка: хорошо
udrees про Атаманов: На службе Фараона [СИ] (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
31 01 Вторая книга написана не хуже первой и держит в напряжении на всем протяжении повествования. Рассказ как обычно идет от двух лиц – человека и котенка. Приключений навалом, написано просто и живо. Немного конечно коробит, когда ……… Оценка: хорошо
udrees про Атаманов: Котёнок и его человек [СИ] (Фэнтези, Самиздат, сетевая литература)
31 01 Хорошее произведение в жанре литРПГ и попаданца. Начало конечно скомканное, читателя сразу бросают в бой, как говорится. Скучное начало быстро пролетает, так как героя сразу перебрасывают в сказочный мир, хотя вру, не сразу ……… Оценка: хорошо
tvv про Лонс: Темный флешбэк [litres] (Детективная фантастика)
30 01 4 книга этой серии (Эксгрегум[litres]) есть на Ф., но размер ее больше 10 мегабайт. Пожалуйста, кто может, сделайте нашу библиотеку еще совершеннее?
Barbud про kv23: Кредитное плечо Магеллана (Альтернативная история, Попаданцы, Историческое фэнтези, Самиздат, сетевая литература)
30 01 Изобилие биржевых терминов, явные анахронизмы типа слова "садист" из уст одного из персонажей или корабельных весов, градуированных в килограммах. Не зашло как-то. Оценка: плохо
Sello про Нечаев: АнтиNаполеон (История, Публицистика)
30 01 Не смог дочитать до конца, хотя до этого несколько прочитанных книг Нечаева дали повод составить об авторе благоприятное мнение. В аннотации написано про "глобальный бренд" по имени Наполеон, но в содержании нечто обратное: ……… Оценка: нечитаемо
Олег Макаров. про Карелин: Торговец Правдой 1 (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
30 01 Феерическая чушь. Как будто взяли штампы и наштамповали. Оценка: нечитаемо
Oleg68 про Хайнлайн: Туннель в небе [Tunnel In The Sky ru] (Научная фантастика)
27 01 Мне понравилось. Не понял отзыв об американских детишках. Американский автор должен писать о советских детишках? Так для этого есть Головачев и другие.
Stager про Оченков: Гроза над Бомарзундом [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
26 01 Первую я с трудом осилил. Автор, конечно, ни в чём не разбирается, но исторический наброс любопытен. А дальше... Автор совсем ни в чём не разбирается... Ну да, сталей у него не было, но было естественно-легированное шведское ……… Оценка: плохо |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы