Делаем fb2 книгу

fb2. Разделы разного уровня, подразделы fb2. Два способа оформления примечаний

Подготовка текста после ска нирования Несколько ссылок: от Jolly Roger: "Рекомендации по сканированию книг" (http://zmiy.by.ru/#help) и (http://www.oldsf.ru/OCR.html) от TaKir: OCR pad (http://www.the-ebook.org/rus/?dl_id=29) поможет со склейкой и чисткой текста после ФР. К нему файлик с регулярными выражениями (http://www.savefile.com/projects/808649681) настройки очистки и склейки надо добавить. Также макрос для ворда (http://www.the-ebook.org/rus/?dl_id=30) - уже после OCR pad можно запускать. ПС. файлик для окрпада надо кинуть в папку OcrPad\BookCleaner открыть нужный ртф, и подгрузить, нажав иконку метелки вверху, там появится кнопочка load. Указать нужный *.bcf. Он самый большой по весу. После чего нажать replace all. Ртф с разделением на строки (но не на страницы) из ФР надо сохранять. ***

Посылка: формат fb2 настолько прост, что работа с ним должна быть на порядок легче, чем с Word-ом, или сравнима с работой в Блокноте. Но сейчас ситуация такая (если продолжать сравнение с блокнотом): чтобы создать нормальный текстовой документ, нужно, как минимум, выучить таблицу кодов.
Причина может быть в том, что весь свой просветительский пыл ДГ истратил на начальном этапе продвижения формата, как только появились первые сторонники формата ему стало не до просвещения. И соратники, собравшиеся вокруг него, разделили это отношение. Результат: 1. наиболее внятную инструкцию по fb2 написал человек не из клуба FictionBook, 2. «сознательно непонятный интерфейс» основного редактора – FBE, где 80% возможностей – скрыты. А дальше будет еще интересней, ДГ заявил, что дальнейшее развитие софта будет «только для своих». То есть, грибной тусовке очень хочется, чтоб они стали клубом Избранных, единственных владеющих истинным фб-знанием.
Ну и хрен с ними, я в общем-то не про них. Я про создание fb2-версий книг, пригодных для чтения.
Создавать их просто, но для этого, из-за особенностей софта, надо знать очень много мелочей. И уже много таких мелочей разбросанно по разным темам на сайте, например, в «Проекте по вычитке...», но там уже две огромных страницы и выискивать нужную информацию непросто. Поэтому предлагаю собрать инфу об создании fb2-книг в одном месте, например здесь.
Темы:
Что такое fb2, его возможности и ограничения.
Программы – основные возможности – скрипты – горячие клавиши:
a. FBE
b. FBD (создавать в этом редакторе книги можно только в связке с FBI и FBE!!!) Обсуждение программы здесь
b0. FBI (входит в пакет FBD)
c. AllReader
d. FB Writer
e. BD (редактирование книг fb2 СТРОГО НЕ РЕКОМЕНДУЕТСЯ!!!)
f. Vim (Unix, PC: MS-DOS and MS-Windows, Amiga, OS/2, Macintosh, Others)
g. другие
Подготовка текста после распознания к переносу в fb-редактор

Важно! Помните, что fb2-книги читают на разных ПК и КПК, а так же конвертируют в разные форматы. Если сделаная вами книга открылась на вашей читалке, это еще полдела.

Просьба: все связанное с созданием таких книг: вопросы и ответы, личный опыт, ссылки на софт и разные FAQ, возникшие проблемы – нести сюда, подставляя заголовки в сообщения. Пусть в начале будет куча-мала, потом можно будет отсортировать.

Просьба2: не поддерживать разоблачительный тон, который я сам же и задал в начале. Главное здесь – сделать книгу, которую можно читать.
PS: я с удовольствием отвечу на вопрос, кто я такой. Но не здесь, а в вашем ЖЖ, если позовете. Обещаю честно рассказать на кого работаю, в каком звании, когда родился и когда умер.
--------
FictionBook Editor v.2.0 beta – первая книги – 0 уровень.
Брать здесь.
Обсуждение программы здесь.

Скачали. Закрыли все работающие программы. Через «выполнить» запустили установку (FictionBook Editor 2.0 beta build 02 Jul.exe). Со всем согласились. Программа установилась и готова к работе.

У вас есть рассказ или статья, которые вам понравились, и вы хотите, чтобы и другие смогли прочитать. Вы, конечно же, обнаружили в тексте опечатки и исправили их, а, так же, отформатировали его (как подготовить текст к переносу в fb-редактор?).

В FBE вместо голубого «Введите сюда краткую аннотацию» добавляете краткое описание текста. Если вам добавить нечего, тогда просто удаляете голубой текст.
К красному «1.0 - создание файла» добавляете ваше сетевое имя, н.п.: «1.0 - создание файла – Ja_esm», если хотите проявить сверхскромность – удалите красный текст, а лучше оставьте как есть: данный текст относится к «истории версий», и, если кто-нибудь впоследствии будет вносить изменения в данный документ, ему не потребуется заново создавать history.
Внутри секции помеченной зеленой вертикальной линией щелкнете правой кнопкой мыши, выберете select body. В меню / Вставка выберете Заголовок. Появляется горизонтальная зеленая линия – место для заголовка ко всему тексту. Сюда вставьте автора и заголовок, скопированные из исходного документа (обратите внимание: если автор и заголовок были выделены курсивом или полужирным, то их, bold и italic, лучше убрать).
Теперь копируем оставшийся текст и заменяем им в редакторе выделенное «Чтобы изменить документ по умолчанию, отредактируйте файл "blank.fb2" вручную»
Мы сейчас находимся в B – body, в том, что будет видно на экранах читалок. Теперь переходим в D – description, информацию о тексте, которая хранится fb2-файлах отдельно.
Щелкаем «D», в открывшемся окне заполняем окошки необходимой информацией, здесь, вроде бы, все интуитивно понятно. Помним, что Жанр, Название и Язык должны быть заполнены обязательно. Не забываем удалить Your и Name в авторе документа, автор документа вы, и вряд ли вас зовут Your Name. Возвращаемся в «B».
Хоть ваш исходный текст и простой, не содержит деления на части и главы, но, все же, одна часть текста отделена от другой прямой линией. Линия не лучший разделитель в fb2-документах, ее лучше заменить тремя звездочками. Создав новый разделитель, выделите его и щелкните *** в правой части меню (или: Alt+S). Вы создали subtitle, и хоть в этой версии редактора он остался приклеенным к левому краю экрана, помните, что в читалках он будет находится в центре строки.
С этим текстом вроде бы всё. Барабаны. Жмем галочку в меню (или: F8) – Проверить. И внизу экрана появляется: Ошибок не обнаружено. Теперь сохраняем его: указываем куда, называем, кодировку выбираем – utf-8. Отрываем новый файл читалкой – все в порядке? Поздравляю, вы сделали вашу первую fb2-книгу! (Ну и пусть это только рассказ или статья – в библиотеках любой файл называют книгой)

Валидатор (F8) ругается, что делать? Что такое тэги в fb2? Как сделать удобно читаемую книгу для всех?

Комментарии

Хм, сейчас обнаружил, что FBE не поддерживает картинки в формате TIFF (да и читалки тоже их не видят).
Вот ведь.. пока не столкнешься, не узнаешь :)
Да и фиг с ним, в PNG даже меньше размер получается.
Кста, если кто не знает, рекомендую - InfranView. Редактировать он не умеет, зато если надо
быстро уменьшить/увеличить/обезать/преобразовать, лучше инструмента еще не видел..

Ага, только jpg и png (для обложки лучше - jpg).
Так же, остановился на InfranView. Лнгкая, бесплатная, по русски понимает (черный PR!).
А вы какие размеры для обложки оставляете и какие параметры устанавливаете при сохранении?

sd написал:

А вы какие размеры для обложки оставляете и какие параметры устанавливаете при сохранении?

Чтобы сохранить баланс между размером/качеством обычно делаю высоту 600 пикс (ширина уже как выйдет)
при разрешении 300 dpi. Сохраню обычно со сжатием 80-90% (ниже не стоит, т.к. сильно качество страдает).
Размер при этом получается не больше 100 кБ, но выглядит хорошо :)
Хе-хе, это конечно только если сам сканю. Если уже готовые обложки, то как получится :)

Я собственно, почему про TIFF вспомнил - сейчас делаю книжку, в которой много чисто ч/б картинок.
По старым временам помню, что TIFF c LZW-компрессией очень хорошо их жмет, а тут облом..
Путем эксперимента выяснилось, что PNG жмет даже лучше, чем TIFF :)

sd написал:
А вы какие размеры для обложки оставляете и какие параметры устанавливаете при сохранении?

200x*.
То есть, ширина - 200 пикселов.
Это как бы стандарт.

ground0 написал:
Это как бы стандарт.

Да? А кто его определил?
Не вы не подумайте, что я против :) Просто лучше договориться о едином представлении.

МихалЫч написал:
ground0 написал:
Это как бы стандарт.

Да? А кто его определил?

Это стандарт де-факто в бывшей Большой Пятёрке (альдебаран, фензин, ...).

Судя по последним поступлениям, от стандарта они отходят, размер стал больше и очень сильно возрос вес. Может быть ожидаются читалки с возможностью вывода картинок на весь экран? (или, уже появились - у меня все 2-х летней давности)

Для JPEG'ов осмелюсь рекомендовать BetterJPEG - для "русскоязычных" оно бесплатно (и автор доступен). А алгоритмы работы с JPEG'ом - весьма качественные.

Я бы добавил к списку полезного софта еще программку AfterScan (не сочтите за рекламу :-))
Я её пользую, когда попадается старый текст с разрывами строк внутри предложения - она довольно неплохо это дело обрабатывает (не 100% конечно, но все же...)

Интересно. А ссылку не приклеите?

http://www.afterscan.com/ru/
"Вылеченная" версия, по-моему, есть на ру.боард

Практически все вошли в последнюю версию FBE.

Лично я использую (использовал, когда делал книги в fb2, сейчас книги я верстаю в docbook) Vim с плагинами xmledit и surround. Ничего удобнее для себя я не нашёл, кроме того я под Линуксом. :)

DMRem написал:
Лично я использую (использовал, когда делал книги в fb2, сейчас книги я верстаю в docbook) Vim с плагинами xmledit и surround.

Вместо xmledit пользую closetag.

Знак ударения в кири́ллице. Используется символ combining acute accent, ставится после ударной гласной. В Меню\ Скрипты\ Символы\ не обнаружен, есть только acute accent, но в русском тексте этот символ смотрится криво. Обнаружил два решения: 1. расставляю ударения в исходном доке и перетаскиваю в FBE (FBE умный, все понимает, только нервный), 2. перехожу в сорс (S) и там подставляю код & #769; (без пробела) после ударных гласных.

Это хорошо, это надо. Одно только НО, этот символ почему-то не во всех шрифтах отображается.
Например, я вот пользуюсь шрифтом Georgia - там вместо этого символа "квадратик".
Хотя, скорее всего, это недостаток шрифта...

Да - шрифта. Лучше всего спец. символы отображают шрифты для юникода: Lucida Sans Unicode, Arial Unicode MS, Palatino Linotype.
Не специалист я. Просто попался текст со старо-русскими символами, треть текста в читалке оквадратилась. Перебором подобрал шрифты, которые все понимали. Теперь во всех читалках: основной шрифт - Palatino Linotype (похож на Times New Roman), дополнительный - Lucida Sans Unicode.

Из всех перечисленных понравился только Palatino Linotype, т.к. Arial-подобные шрифты органически
не перевариваю (в смысле, читать с экрана). А вообще, знак ударения требуется достаточно редко,
для таких букв как ы, я, для которых нет соответствующего символа в расширенной латинице.
Для всех остальных (а,е,о,у) есть соотв.символ - их и использую.
Может, конечно, я и не прав...

Для орфоэпического словаря или для этой книги растановка ударений уже не мелочь, и делать ее лучше одним способом, а не пятью.
Т.е. какая карта (книга) выпадет... :)

sd написал:
Для орфоэпического словаря или для этой книги растановка ударений уже не мелочь, и делать ее лучше одним способом, а не пятью.

...(Почесав макушку) Пожалуй, соглашусь. Как раз делаю что-то подобное.
Вот значит, родилось еще одно правило для вычитывающих - использовать в качестве
знака ударения именно знак ударения
, а не всякие-разные символы из латиницы :)

МихалЫч написал:
Это хорошо, это надо. Одно только НО, этот символ почему-то не во всех шрифтах отображается.
Например, я вот пользуюсь шрифтом Georgia - там вместо этого символа "квадратик".
Я предпочитаю вердану - с ней ещё веселее: в ней ударение появляется на букве, перед которой стоит символ ударения. Я уже успел так сделать несколько книг. Теперь мучают сомнения - как всё же правильно?

Из Википедии: В Юникоде нет готовых русских букв с ударением, но их можно делать составными, добавляя символ U+0301 (combining acute accent) после ударной гласной (например, ы́, э́, ю́, я́). Так что это персональный баг верданы. Читайте здесь. Либрусек тоже на вердане, видите как уползли ударения. PS Одно время в wiki на фик-буке писали: для расстановки ударений используйте & #769; перед ударной гласной. Потом поменяли на после.

Решение Ударения в Verdana встают на место.

Вообще-то пользоваться латиницей в кириллице - моветон. ;) Даже скрипт есть, который латинские буквы в кириллическом тексте подчищает.

Я пользуюсь & #769; в сорсе. Пока таких знаков в тексте не слишком много - не страшно.

Да уже вправили моск :)
В следующий раз жмите на "ответить", а то непонятно, к чему относится этот пост.
Вот так постепенно у нас и появится FAQ по вычитке :)

1. Если у вас исходный файл большого размера, например jpg от 0,2 до 2 Мб. Открываем этот файл в InfranView, идем в Меню\ Изображение\ Изменить размер изображения. Проверяем, что опция "Сохранить пропорции" включена. Выбираем "Новый абсолютный размер", включаем "пикселы" и устанавливаем ширину – 200. (Выбор такой ширины связан, скорей всего, с тем, что файл будут читать на КПК с 3,2-3,5 дюймовым экраном.) В "Методе изменения размера" выбираем "Ресэмплирование" и Фильтр "Lanczos [самый медленный]". Все - "ОК".
Меню\ Файл\ Сохранить как. В появившемся справа окошке отключаем все опции, устанавливаем "Качество" – 70 – 80, где-то так. В основном окне сохранения даем имя, например: cover. Тип файла: JPG – JPEG файлы. Сохранить. Проверяем вьювером, если результат не радует, возвращаемся в незакрытую программу и повышаем Качество. Вес файла будет 20-40 Кб.
2. Если у вас исходный файл меньше 30 Кб и ширина картинки меньше 200, растягивать его не стоит. Просто сохраните его с Качеством 100 в формате JPEG.
3. Ширина картинки меньше 200, размер – больше 30 Кб. Можно попробовать увеличить картинку до 200, Качество при сохранении – 100.

Это не инструкция для беспрекословного исполнения, скорее, основанное на небольшом опыте ИМХО.

sd написал:
Качество при сохранении – 100.

Это не инструкция для беспрекословного исполнения, скорее, основанное на небольшом опыте ИМХО.


Мой опыт говорит, что "качество 100" (и даже больше, чем 90) - бесполезно.
Т.к. "пережатие" (JPEG - сжатие "разрушающее", с потерями) происходит всё равно, а размер нередко растёт.
Ограничьтесь (или хотя бы попробуйте) - 85.
Старайтесь не пересохранять файл (см. выше) - используйте оригинал для получения нового варианта.

jno написал:
Ограничьтесь (или хотя бы попробуйте) - 85..

Если по пункту 1., то согласен полностью.
По пункту 3.: Взял картинку (jpg) 46Кб и шириной 480, сузил до 200, сохранил с параметрами "Качество" 85, 90, 95 и 100. Получил четыре файла: 7,7Кб, 9,7Кб, 14Кб, 28Кб. Вес файла не увеличился, а уменьшился! – потерялась информация не связанная с изображением (все дополнительные опции при сохранении были отключены). Загнал исходный файл и новые в тестовый документ и просмотрел. Лучшее качество было у сотки, разница с 85-м заметна.
Когда файл небольшой, многое зависит от его свойств, поэтому нужно просматривать результаты и вносить коррективы. А поэтому:
jno написал:
Старайтесь не пересохранять файл (см. выше) - используйте оригинал для получения нового варианта.

Очень нужное уточнение. После внесения изменений сохраняйте его под именем, отличным от имени оригинала!

Ну и уж - до кучи: если обложка - не фотография (рисованная), то имеет смысл попробовать сохранить её в формате PNG (Portable Network Graphics). Иногда это позволяет ещё немного сэкономить на размере.

Я так обычно со всякими картинками типа юзерпиков/аватаров вожусь - где-то удаётся выиграть, где-то - нет.

AFAIU, при подготовке книги пара-тройка лишних сэйвов погоды не сделают, а вот экономия в несколько килобукв может оказаться полезной (особенно для старых машинок, типа моей соньки :) и для сетевого трафика - за него пол России ещё платит, кстати).

И поимейте в виду: ваши килобуквы изображения ещё уполторачатся после base64 кодирования в результирующий файл!

jno написал:
Ну и уж - до кучи: если обложка - не фотография (рисованная), то имеет смысл попробовать сохранить её в формате PNG (Portable Network Graphics). Иногда это позволяет ещё немного сэкономить на размере.

К сожалению, PNG (точнее PNG-8) чаще позволяет выиграть, если изображение изначально электронное, так как кодирует отличие пикселей от предыдущей строки\столбца (http://www.artlebedev.ru/tools/technogrette/etc/png-1/ например). А в сканированных рисунках, даже если на обложке много фона, одного цвета все равно не получается :(, поэтому все же лучше работает загрубление jpg.

Ага. Значит, придётся всё, что успел слепить - переделывать, а от верданы отказываться. (Или можно как-то этот глюк исправить в файле шрифта? А то отказываться жалко - на моей "буке" (LBook V3) смотрится лучше люболго другого шрифта.)

Рыжий Тигра написал:
Или можно как-то этот глюк исправить в файле шрифта?

Не знаю такого способа (:
Lucida Sans Unicode вроде бы похож на вердану

В Меню/ Скрипты/ Символы/ Спецсимволы нет символа для ударения в кириллице (combining acute accent). Зато есть символ для мягкого переноса, который мне не нужен. Решил это исправить, и вот что получилось.
В папке Program Files\FictionBook Editor\cmd есть файл spez.htm. Открываю его html- редактором (можно и текстовым, Блокнотом, например, лишь бы поддерживал UTF-8). В двух списках с кодами меняю & #173; на & #769; (пробел после & убрать). В двух списках с подсказками меняю Мягкий перенос (т.е. при необходимости) shy на Знак ударения combining acute accent Сохраняю. Проверяю в FBE – работает.
Точно так же можно удалять ненужные и добавлять нужные другие символы.

Решил перевести fb2 в html с помощью FBE, раньше все проходило отлично, а теперь выдает:

Цитата:
COM Error
Code: 80040154[Класс не зарегистрирован]

Что это такое и как с этим бороться?

Не встречала такую ошибку.

Попробуй задать свой вопрос здесь.

Может кто подскажет где можно скачать книги в этом формате и большом количестве....
Спасибо

Books написал:
Может кто подскажет где можно скачать книги в этом формате и большом количестве....
Спасибо

Ого, спамеры на либрусеке? Прогресс...

Кот-Баюн написал:
Books написал:
Может кто подскажет где можно скачать книги в этом формате и большом количестве....
Спасибо

Ого, спамеры на либрусеке? Прогресс...

От смеха не удержался...

Алексей_Н написал:
Кот-Баюн написал:
Ого, спамеры на либрусеке? Прогресс...

От смеха не удержался...

Где вам смешно?

Цитата:
Где вам смешно?

Думал о чем-то своем, и поэтому не совсем оказался в теме...
Сглупил, короче...

Сделал fb2 "Маленький принц"из .дос для изучения языка по методу И.Франка.В AlReader выглядит вроде нормально, даже с картинками. А вот выделить цветом русский и французский тексты не выходит. (так читать и учить легче). Это вообще возможно? И возможна ли какая-то автоматизация процесса (по типу шрифта, например, французский - курсив, а русский - обычный и т.п.)?

nik-sv написал:
Сделал fb2 "Маленький принц"из .дос для изучения языка по методу И.Франка.В AlReader выглядит вроде нормально, даже с картинками. А вот выделить цветом русский и французский тексты не выходит. (так читать и учить легче). Это вообще возможно? И возможна ли какая-то автоматизация процесса (по типу шрифта, например, французский - курсив, а русский - обычный и т.п.)?

А, зачем делать это в формате, который совершенно для этого не предназначен (откровенно говоря — он вообще мало для чего предназначен)? Делайте в LaTeX — там и шрифт, и цвет, и язык, да и вообще всё, что угодно сделаете так, как вам того хочется.

nik-sv написал:
А вот выделить цветом русский и французский тексты не выходит.

В fb2 нет возможности назначать цвета.

sd написал:
nik-sv написал:
А вот выделить цветом русский и французский тексты не выходит.

В fb2 нет возможности назначать цвета.

Если вьюер позволяет выделять элементы цветом, то можно сделать - просто назначить тексту в emphasis свой цвет.
Интересно, есть такие?
На FBReader посмотрел - не умеет.

Правильно: сам fb2 не поддерживает цвета, но в читалках в настройках можно назначить цета для разных стилей (варианты для РС). Хали, Кул, Олридер

Малолетний Д. написал:
sd написал:
nik-sv написал:
А вот выделить цветом русский и французский тексты не выходит.

В fb2 нет возможности назначать цвета.

Если вьюер позволяет выделять элементы цветом, то можно сделать - просто назначить тексту в emphasis свой цвет.
Интересно, есть такие?
На FBReader посмотрел - не умеет.

Можно французский определить как цитату: Выделить французский и сделать Вставка/Цитата
Тогда текст "цитаты" по умолчанию будет другого цвета(по крайней мере по умолчанию в версии CoolReader2.00.66), если нет, то можно настроить, как именно отображать цитаты(в CoolReader клавишей F9)

Народ подскажите что работает с заладками Alreadera? а то ошибки поисправля , а заново пзлить хочется без егмора

зачем что-то делать, если просто можно скачать. В сети масса книг в этом формате. Вот например целый сайт только с этим форматом http://kpkbook.ru всё без проблем качается

goodchelovek написал:
зачем что-то делать, если просто можно скачать. В сети масса книг в этом формате.

А в сети они, на Ваш взгляд, самозарождаются?

Ой, а у меня тоже вопрос есть! Правда-правда!
Я даже на Флибусте спросила, только мне никто-никто не ответил. Наверное я глупые вопросы спрашиваю. :(
Вот в библиотеке есть книжка-сборник, совсем-совсем без картинок, а у меня один романчик из нее одной книжечкой. Смешной-смешной и картинок много и комментарии в конце нужные, я бы без них наверно не поняла бы ничего, и еще сносочки на страничках.
А еще в сборнике переводчик тот же, а слова поменяли "лиценциат" на "лисенсиат". Может и еще поменяли, только я не заметила.
А еще мне эту книжечку отсканировать обещали, если я попрошу. А я не знаю, надо всю или нет. Может быть просто взять текст из сборника и в него картинки с комментариями вставить?

Страницы

X