вычитка 2

Архив тем по вычитке:
1. 2008-I
2. 2008-II (эта тема скоро тоже уйдет в архив, никто не против?)





для начала, если хотите поучаствовать, загляните в таблицу.






начальный вариант faqa по вычитке:

Как выбрать (найти) книги для переделки:

Способ №1.

Справа вверху страницы возле окошка «Поиск книг» жмем «Расширенный поиск».

В окошке «формат» пишем, например rtf (или txt, pdf, doc).

Видим ниже список книг и авторов, у которых есть книги в искомом формате.

Жмем на название книги, попадаем на ее описание.

Качаем файл с книгой (скачать rtf).

Способ №2.

Вверху страницы выбираем любую букву, на которую начинаются фамилии авторов, нажимаем.

Например, буква «Б» (http://lib.rus.ec/Bb).

В окошке «формат» пишем, например rtf (или txt, pdf, doc).

Видим ниже список авторов, у которых есть книги в указанном формате.

Также справа в скобках видим кол-во книг в этом формате у каждого из найденных авторов.

Выбираем какого-либо автора из этого списка.

Нажимаем ссылку, допустим, (http://lib.rus.ec/a/31045) ищем, у каких книг указано: (скачать rtf).

Качаем этот файл, прикидываем свои силы, берем файл в работу (для переделки его в формат fb2).

Во избежание того, что кто-то еще может взять этот же файл и сделает лишнюю работу, помечайте взятый файл (название книги) добавлением к названию в квадратных скобках слова «вычитывается».

Например Людина біжить над прірвою [вычитывается]

Способ № 3.

Проект по вычитке книг в библиотеке создан для координации и учета вычитываемых книг, а также он принимает заявки от читателей на вычитку-правку или перевод в fb2 конкретных книг.

Список книг, их статус и список участников можно посмотреть тут:

http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Для официального участия в проекте, надо заявить о желании сделать (вычитать) книгу из списка (таблицы). Сделать это можно в этой теме http://lib.rus.ec/%D0%B2%D1%8B%D1%87%D0%B8%D1%82%D0%BA%D0%B0

После заявления о желании редактировать книгу кто-то из библиотекарей внесет ник в таблицу, чтобы избежать накладок.

Книги, нуждающиеся в вычитке (или конвертации в fb2), указаны в столбцах «Книга» и «ссылка». Нужные действия с этой книгой - в столбце «комментарии».

Тут все просто.

Как пометить файл - [вычитывается]:

Чтобы дописать [вычитывается] к названию книги, жмем на название данной книги, видим: (http://lib.rus.ec/b/107615/edit)

Людина біжить над прірвою 3158K (книга прочитана 16 раз) (скачать rtf) издание 1965 г. (исправить)

Нажимаем «исправить».

В окошке с названием дописываем в конце [вычитывается].

Жмем правее кнопку «Сохранить новое название».

Теперь этой книге присвоено новое имя, которое показывает, что кто-то над ней работает.

Некоторые моменты по оформлению fb2-книг:

Дальше делаем нужные операции по созданию fb2.

Самое главное - создать полностью валидный fb2. Чаще всего проблема валидации после автоматического конвертера заключается в незаполненном жанре и языке книги в дескрипшене файла. Естественно автор и название книги тоже необходимы для валидации.

В получившемся fb2 в дескрипшене также по возможности заполняем окошко Source URLs, если в исходном файле указано, откуда он взят. Если никаких опознавательных знаков нет - не заполняем. Это же касается автора скана или исходного файла (Source OCR).

Обязательно меняем номер версии, если правился fb2-файл, а не создавался новый. Как правило, его увеличивают на 0,1.

Также в history исправляемого fb2-файла не забываем описывать произведенные изменения (например - вычитка).

Если в файле назван автор документа (в разделе ), оставляем его имя, меняя лишь дату в этом же разделе. Единственное исключение - автор rusec. Это - имя автоматического скрипта, заливавшего книги в библиотеку на начальном этапе. Его имя меняем на свое.

Заливка fb2-книги в библиотеку:

Когда книга готова, заливаем ее в библиотеку обычным образом.

Если данные об авторе и название созданной fb2-книги совпадают с указанными в исходном rtf, новая fb2-книга окажется в списке книг нужного автора.

Если правился существующий в библиотеке fb2-файл и в нем не изменялось название книги и имя автора, при заливке в библиотеку обязательно будет найден дубль (старая версия книги).

Появится сообщение: «Кажется, нашли дубля. Ткните в него для разрешения конфликта.»

В появившейся на экране таблице выбираем нужную книгу, нажав внизу колонки на линк «оставить эту».

Если почему-то дубль не был обнаружен, после заливки объединяем залитую книгу с исходной (не рекомендуется просто удалять исходную, т.к. при этом теряются все рецензии, оценки и статистика).

Для этого на странице книге нажимаем поочередно линки:

«Исправить», потом внизу страницы - «Объединить с другой книгой (отработка дублей)». В открывшемся окне вводим название нужной книги или ее ID (предпочтительнее). Затем в открывшемся окне выбираем исходную книгу и снова оказываемся в таблице сравнения, где и выбираем окончательно книгу, которую нужно оставить.

При этом способе вся важная информация, относящаяся к данной книге сохраняется.

UPD. забыл =)
все гратцы TaKir'у. целуйте ему ноги )

Комментарии

mazay написал:
Это обычная редакторская правка.

Этика редактора – любое изменение только с разрешения автора/ переводчика. Нарушение – хамство – явление не редкое, но зачем это хамство тащить и сюда. У вас есть веские основания, чтобы считать, что персонаж М в одной книге является N в другой, отлично, вы можете об этом сообщить в аннотации к книге (она редактируется пользователями), в комментариях, создать топик по обсуждению данного перевода. Вносить изменения в текст – нельзя, потому что у вас нет разрешения от автора текста. По этой же причине, объединение файлов нельзя считать изданием. Но никто не мешает вам оставить свой комментарий

sd написал:
mazay написал:
Это обычная редакторская правка.

Этика редактора – любое изменение только с разрешения автора/ переводчика. Нарушение – хамство – явление не редкое, но зачем это хамство тащить и сюда.

Если уж заводить разговор об этике, то не стоит забывать и об этике переводчика. Переводит он одну из книг серии, _заведомо_, _не первую_! И _всю серию_ _переводить не собирается_, ему следовало бы поинтересоваться системой имен/названий/терминов в предыдущих книгах. А свое мнение о том, как следовало бы перевести то или иное имя/название/термин дать в примечании переводчика, подбирая выражения, однако, чтобы не поставить под сомнение своих коллег.

Но этот вопрос не тема для дискуссии в данном контексте.
Вопрос был задан, ответ получен.

И все-таки, вычитывать МИФологию в ворде, или нет?

В ворде. И очень хорошо будет, если вы в местах, где сделали исправления, поставите какой-нибудь знак, например: +. Чтобы не гонять «сравнить по тексту».
Спасибо, что не стали вступать в перепалку об этике.

Ворд позволяет редактировать ФБ-файл как XML, при этом высвечиваются все теги, но иллюстраций не видно. Все механизмы правки работают, но после сохранения файл как фб не открывается. Может быть имеются средства поправить?
Для уменьшения объема пересылки текст буду посылать в виде txt. Если придумаю, как, не особо напрягаясь, сделать список поправок (только не в виде "было - стало"), то сообщу.

PS А вот разговор об отношениях в цепочке Автор - Редактор - Издатель - Читатель можно было бы и продолжить. Только в спокойных тонах и не здесь. Возможно в этой цепочке должно быть еще одно звено: Библиотекарь.
И еще. Не хотелось бы передавать полуфабрикаты через каталог автора. Может быть, сделать какой-нибудь адрес для заливки/скачивания?

Можно посылать на bibliotekar.librusec_на_gmail.com

А нет возможности поставить FBE (FictionBook Editor)? Там можно править в экранном режиме, как в ворде. Если не менять структуру (перемещать разделы, заголовки) и файл изначально валиден, то исправляете опечатки, сохраняете - готов fb2, можно заливать.
Требования: WindowsXP, MSXML 4.0

Цитата:

А нет возможности поставить FBE (FictionBook Editor)?
...
Требования: WindowsXP, MSXML 4.0

Меня предупредили, что MSXML 4.0 может нарушить то шаткое равновесие, в котором находится сейчас моя система.
А переинсталлировать все я сейчас не готов.

sd написал:
А нет возможности поставить FBE (FictionBook Editor)? Там можно править в экранном режиме, как в ворде. Если не менять структуру (перемещать разделы, заголовки) и файл изначально валиден, то исправляете опечатки, сохраняете - готов fb2, можно заливать.
Требования: WindowsXP, MSXML 4.0

Поставил FBE. А вот как редактировать (вычитывать!) в этом редакторе - что-то не пойму. Хэлпа нет. Достаточно подробного описания нет. Насколько смог понять за полчаса беглого знакомства, все построено на плагинах. А где их взять?
Нашел описание редактора на www.reeed.ru. но там про плагины ни слова.
Средств для проверки текста нет!
Остается только одно: тащить текст в ворд, а потом снова конвертитровать? Или есть какие-то наработанные методы вычитки в этом редакторе?
Аватар пользователя Captain Scarlett

Цитата:
Или есть какие-то наработанные методы вычитки в этом редакторе?

Единственно надежный метод вычитки в _любом_ редакторе: внимательно читаете текст и исправляете замеченные опечатки. Скрипты - вещь полезная, но они выполняют чисто вспомогательную функцию. Можно, конечно, пользоваться только скриптами и спеллчекером, но тогда не нужно говорить, что книга вычитана.

izaraya написал:
Можно, конечно, пользоваться только скриптами и спеллчекером, но тогда не нужно говорить, что книга вычитана.

Вообще-то, для вычитки кроме спеллчекера нужно хорошее знание русского языка. Но спеллчекер ускоряет вычитку в разы!
Аватар пользователя Captain Scarlett

Цитата:
Но спеллчекер ускоряет вычитку в разы!

Бесспорно :) Просто если вычитывается не текст сразу после OCR, а книга из библиотеки, то вероятность того, что через спеллчекер ее уже прогнали - процентов 90.

izaraya написал:
Цитата:
Но спеллчекер ускоряет вычитку в разы!

Бесспорно :) Просто если вычитывается не текст сразу после OCR, а книга из библиотеки, то вероятность того, что через спеллчекер ее уже прогнали - процентов 90.

Судя по качеству вычитки, чаще всего вычитка либо не делалась вовсе, либо делали ее как раз в фб2-редакторе.
Первая фраза текста из первой книги "Мифтерии"
Цитата:
Одно из немногих все искупляющих качеств наставников...

mazay написал:
А вот как редактировать (вычитывать!) в этом редакторе - что-то не пойму. Хэлпа нет. Достаточно подробного описания нет.

Поэтому ответить на ваш вопрос не просто.
Есть еще эта книга, там тоже есть описание FBE.
Несколько советов о неочевидном:
1. Очень помогает вылавливать ошибки и мусор в тексте плагин – скрипт – Слипшиеся слова, но тот, что уже установлен в FBE, имеет баг и поэтому опасен. Его лучше или исправить, или заменить на обновленный: с этой страницы скачиваете архив с коллекцией скриптов. Файл 05_Слипшиеся слова.js из папки 05_Чистка копируем в папку \Program Files\FictionBook Editor\cmd\05_Чистка\ Спросит: Заменить – отвечаем: ОК.
2. FBE можно перетаскивать выделенные участки текста. Осторожно! Если этот участок находится у границы секции или заголовка, выделять нужно очень точно, иначе при перетаскивании можно перетащить также секцию или заголовок. Если такое случилось – Отмена в помощь.
Правописание проверяю именно так: таскаю в ворд. Но такие ошибки бывают редко, обычно тексты уже проверенны программно, исправлять приходится то, что не прошло теста Тьюренга.

sd написал:
... обычно тексты уже проверенны программно, исправлять приходится то, что не прошло теста Тьюренга.

А что такое тест Тьюренга?
Машину ТьюрИнга знаю...
Теперь, что касается скриптов. Скачал весь архив. Нужно ли заменять все установленные скрипты, или только "слипшиеся слова"?

> Машину ТьюрИнга знаю...
И ворд знает про И. А я путаюсь, но помню, что у этого теста есть другое название: тест «неразличимости».
>
Только «слипшиеся слова».
На счет других – не знаю, не было необходимости.

считаю, что вычитывающий вправе менять систему имен и названий на правильную.
но только после согласования с остальными билиотекарями...

потому что это важно.

soshial написал:
считаю, что вычитывающий вправе менять систему имен и названий на правильную.

Вычитывающий имеет право только на исправление очевидных грамматических и орфографических ошибок (см. тж. "корректор"). Менять систему имён и названий имеет право только переводчик (даже, ИМНСХО, не редактор), хотя лично я бы и меняющим переводчикам перебил шесть и более конечностей ©, ибо ни разу ещё не видел изменений *к лучшему*.

soshial написал:
но только после согласования с остальными билиотекарями...

Это и вовсе иррелевантно.

pkn написал:

Вычитывающий имеет право только на исправление очевидных грамматических и орфографических ошибок (см. тж. "корректор"). Менять систему имён и названий имеет право только переводчик (даже, ИМНСХО, не редактор), хотя лично я бы и меняющим переводчикам перебил шесть и более конечностей ©, ибо ни разу ещё не видел изменений *к лучшему*.

Начнем с того, что переводчики - тоже люди, и имеют право на ошибку. В том числе, и смысловую, и стилистическую. А это дает право редактору эту ошибку исправить.
Что касается системы имя/название/термин.
Эта система должна выдерживаться на протяжении всей серии. И поддерживать ее должен Издатель. И если Переводчик (а он, кстати, не автор!, он - технический специалист!, как тот же редактор, корректор и т.п.) не соглашается на изменения, предлагаемые Редактором, _не соглашается работать в команде_, то кто-то должен сделать соответствующие выводы.
Поскольку основным звеном всей цепочки, которая начинается с автора, - это ЧИТАТЕЛЬ!
В нашем случае все-таки имеет место издание (а, кстати, что такое "издание"). И хотя мы всего лишь копируем книгу, созданную Издателем, на наши плечи, по-видимому, ложится задача исправления ошибок Издателя.

в любом случае, я не собираюсь ничего менять, не посоветовавшись со всеми вами.
а так, мы, наверно, каждый останется при своем )

soshial написал:
в любом случае, я не собираюсь ничего менять, не посоветовавшись со всеми вами. а так, мы, наверно, каждый останется при своем )

Наверное, самым разумным будет дать в примечании верные (ну, или более распространенные) названия и имена, оставив несоответствие на совести издательства.
(Об этике издателя умолчим!)

Возможно имеет смысл сделать новый вариант книги? Что-то типа :

Мифальянсы (пер. XYZ, ред. Либрусек)

Вместо Либрусека можно поставить чей-то ник, если работа не коллективная.

Прочитал книгу (Пучков Д. Ю. Санитары подземелий) нашел кучу опечаток, исправил и немного улучшил структуру fb2. Хотелось бы поучаствовать в улучшении библиотеки и заменить эту книгу на исправленную. В дельнейшем также буду помогать исправлять в книгах ошибки.

Корней написал:
Прочитал книгу (Пучков Д. Ю. Санитары подземелий) нашел кучу опечаток, исправил и немного улучшил структуру fb2. Хотелось бы поучаствовать в улучшении библиотеки и заменить эту книгу на исправленную. В дельнейшем также буду помогать исправлять в книгах ошибки.

Отлично, спасибо.
Увеличьте номер версии на одну десятую и заливайте. (Не забудьте объединить книги, оставив улучшенную версию.)
Рады Вас видеть в наших рядах! :))

Заливать в zip'е?

Корней написал:
Заливать в zip'е?

Не обязательно.

Возник такой вопрос: в библиотеке есть книга в djvu

EURO-2008. Бронзовая сказка России (djvu)

я ее распознала и перевела в fb2

EURO-2008. Бронзовая сказка России (fb2)

нужно ли их объединять? Имеет ли смысл оставлять в библиотеке книгу в формате djvu?

Предпочтительнй формат на либрсеке - fb2. Если вы уверенны, что текст воспроизведен полностью, структура его сохранена, то лучше объединить, оставив fb2.

n_a_u написал:

нужно ли их объединять? Имеет ли смысл оставлять в библиотеке книгу в формате djvu?

Там, я думаю, цимус в иллюстрациях. Если результирующий fb2 ненамного беднее иллюстрациями, чем исходный djvu, то имеет смысл объединить, и djvu похерить - всё равно он не умирает насовсем, сильно желающий всегда сможет восстановить. Если же в djvu очень, очень намного больше иллюстраций, и они важны для книги - то я бы оставил и djvu тоже, обозначив в названии "(с иллюстр.)".

Дело в том, что fb2 сформирован из распознанного djvu. Все иллюстрации, которые были в djvu, остались и в fb2.
Но кто-то уже решил мою дилемму и объединил эти книги )))

Несколько замечаний после беглого просмотра:
1. Не надо дублировать обложку в начале книги. Обложка книги и так отображается в большинстве читалок в самом начале. Т.е. — первая иллюстрация лишняя.
2. Рекомендуемый размер для обложки в fb2 240 на 240. Первая иллюстрация ближе к рекомендации, ее и надо было использовать как обложку.
3. У книги сложная структура. Вам было бы проще ее передать, если бы вы использовали больше возможностей формата. Стихи лучше делать стихами (Меню/ Вставка/ Стихи), а не курсивом. Несколько раз можно было использовать стиль Цитата.
4. После создания файла используйте скрипт Генеральная уборка, он подгоняет оформление под стандартное для fb2.
Так же хорошо прийтись скриптом Унификация иллюстраций.
Если будете дорабатывать файл, уберите непонятную секцию с точкой в начале. Также у вас сдублировался тег <p> в history.
К сожалению, посмотреть подробнее сейчас не успеваю.

Поправила файлик с учетом Ваших замечаний, заменила.
Спасибо за ликбез )))

Вам спасибо за fb2-версию

в книга Аэлита Толстого (написана по-моему годах в 20-х) очень часто встречается форма "итти", а не "идти"... скажите, такое было популярно в то время или это много опечаток??
о_О

Аватар пользователя Captain Scarlett

Это не опечатка, "итти" - устаревшая форма.

вот я так и подумал =)
спасибо ;)

"Бунт вурдалаков" Юрия Петухова беру. Где-то даже книжки лежат.. Автор, помнится, сам издавал, за свой счет.
Я, соответственно, у него прям и заказывал. Лихие 90-е...

Трэба снять знак качества с книги Филенко Сага о Тимофееве (рассказы), т.к. там была куча ошибок OCR. Я по ходу чтения поисправлял, но заменить книгу теперь не имею возможности.. Поторопились замораживать.
...
Отбой, все сделано.

Огромное спасибо за внесение корректуры!

Привет народ!
Столкнулся с такой проблемой при вычитке и конвертации. После сканирования и распознавания обнаружилось что часть диалогов предваряется просто длинным тире (которое отображается при конвертации в fb2) а часть представляет собой знак длинного тире из списка ( представьте - может быть нумеруемый список - 1,2,3 - может быть список с каким нибудь значком перед строкой - вот это из этой оперы и при конвертации в fb2 не видится). Кто нибудь знает алгоритм автоматизированной замены знаков списка на обычное длинное тире?

Аватар пользователя Captain Scarlett

"найти" и "заменить" не подойдет? :)

Неа - это не проходит - предлагаю попробовать. Создать список со значком тире в начале каждой строки - а потом попыиаться его заменит автоматом

Аватар пользователя Captain Scarlett

В Ворде?

Да в Ворде.

Макрос для ворда у меня есть по автозамене такой хрени.
Выделить весь текст и запустить макрос.

Sub A_Spisok_dialog()
'
'
' A_Spisok_dialog макрос
' макрос создан 25.03.2008 TaKir

ActiveDocument.Range.ListFormat.ConvertNumbersToText
For Each a In ActiveDocument.Shapes
a.Select
Selection.ShapeRange.TextFrame.TextRange.Select
Selection.Range.ListFormat.ConvertNumbersToText
Next a

Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = "^t"
.Replacement.Text = " "
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchAllWordForms = False
.MatchSoundsLike = False
.MatchWildcards = False
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub

Здорово - а как бы мне его заиметь? :)

Во это действительноздорово -а то я думал промучаюсь черт знает скока.. :) Спасибо - все сработало

Всегда пожалуйста )

Barson написал:
Привет народ!
Столкнулся с такой проблемой при вычитке и конвертации. После сканирования и распознавания обнаружилось что часть диалогов предваряется просто длинным тире (которое отображается при конвертации в fb2) а часть представляет собой знак длинного тире из списка ( представьте - может быть нумеруемый список - 1,2,3 - может быть список с каким нибудь значком перед строкой - вот это из этой оперы и при конвертации в fb2 не видится). Кто нибудь знает алгоритм автоматизированной замены знаков списка на обычное длинное тире?

Куда отсылаются результаты оцифровки? Если в ворд, то часто длинное тире с отступом (признак диалога) распознается Файнридером как маркированный список. В этом случае при выделении абзаца тире и знак табуляции (включить показ непечатаемых символов см. рисунок) не выделяются.
При этом иконка маркированного списка обведена рамкой (см. рисунок)
Если фрагмент с маркированным списком скопировать и вставить как неформатированный текст (Правка/Специальная вставка/Неформатированный текст) то в тексте появляются тире и символ табуляции, которые уже вполне управляемы.
Остается только заменить табуляцию на неразрывный пробел.

Уточню - в Ворде это называется маркированный список

Я тут взялся было за вычитку "Демонов в раю" Липскерова, но столкнулся с проблемкой. Предлагаемый doc имеет ошибки сканирования, в т. ч. нечитабельные символы. Кое-какие по смылсу исправляешь, но некоторые не поддаются никакой расшифровке.
Бумажного варианта под рукой не имею, сравнить не с чем...
Может кто-нибудь перехватит инициативу и доведет вышеназванный файл до конца?
Буду весьма признателен.

Добрый день.
Нужна подсказка:
1 - есть текст с проставленными сносками в формате {число}, в конце текста - {число} текст сноски. НО всё это оформлено обычным стилем (т.е. не сносками). Теперь вопрос -можно ли сделать так, и как?, чтобы первое подружить со вторым (т.е. {1} после слова, соотнести с {1} ля-ля-ля - в конце).
2 - залил книгу Виктора Фёдорова - "Закон моря", но там не все рассказы, а только 4 из 7. их так и оставить одним файлом, или каждый рассказ отдельно? Так же у него есть повесть - "Пропавшие без вести" http://lib.rus.ec/b/111013 изданная в сборнике "Закон моря" - аннотации, год издания совпадают. Наверно это надо как-то отметить?

Страницы

X