<?xml version="1.0" encoding="UTF8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>BookDesigner 5 &#187; Articles</title>
	<atom:link href="http://www.bookdesigner.ru/?feed=rss2&#038;cat=3" rel="self" type="application/rss+xml" />
	<link>http://www.bookdesigner.ru</link>
	<description>Free Publisher and Book Designer (Программа для редактирования, чтения и изготовления электронных книг. Легка в управлении как для новичков, так и для опытных пользователей. Постоянно обновляется и поддерживает множество входных и выходных форматов.)</description>
	<lastBuildDate>Tue, 27 Jan 2009 13:10:33 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>OCR Pad не менее важен для подготовки книг!</title>
		<link>http://www.bookdesigner.ru/?p=22</link>
		<comments>http://www.bookdesigner.ru/?p=22#comments</comments>
		<pubDate>Sat, 28 Jun 2008 17:18:32 +0000</pubDate>
		<dc:creator>Administrator</dc:creator>
				<category><![CDATA[Articles]]></category>
		<category><![CDATA[News]]></category>

		<guid isPermaLink="false">http://www.bookdesigner.org/wordpress/?p=22</guid>
		<description><![CDATA[Одно из основных практических применений программы OCR Pad &#8211; чистка и склейка (доработка) текста после программ распознавания текста. OCR Pad – незаменимый помощник при оцифровке книг. Основные возможности: 1. Полная поддержка юникодов. Плюс 5 виртуальных клавиатур: греческая, математическая, западно-европейская, восточно-европейская и разные экзотические символы. 2. Поиск плохих слов по списку пользователя. Двух типов: как рекурсивный [...]]]></description>
			<content:encoded><![CDATA[<p>Одно из основных практических применений программы OCR Pad &#8211; чистка и склейка (доработка) текста после программ распознавания текста. OCR Pad – незаменимый помощник при оцифровке книг.</p>
<p style="text-align: center;"><img style="max-width: 800px;" src="http://www.the-ebook.org/rus/wp-content/uploads/2008/06/ocrpadwindow.jpg" alt="" /></p>
<h2><span class="postbody"><span style="font-weight: bold;">Основные возможности:</span></span></h2>
<p><span class="postbody"> <span style="font-weight: bold;">1. Полная поддержка юникодов</span>.<br />
Плюс 5 виртуальных клавиатур: греческая, математическая, западно-европейская, восточно-европейская и разные экзотические символы.</span></p>
<p><span style="font-weight: bold;">2. Поиск плохих слов по списку пользователя</span>. Двух типов: как рекурсивный (с показом каждого найденного слова), так и молчаливая отметка всех найденных слов.</p>
<p><span style="font-weight: bold;">3. Find/Replace c полной юникодной поддержкой и поиском по регулярным выражениям (RegExp). </span>Поддерживается сохранение четырех отдельных историй поиска/замены (запоминает до 50-ти последних Find/Replace для каждой из четырех):</p>
<p>поиск: обычная история и история RegExp<br />
замена: обычная история и история RegExp</p>
<p>Окна истории открываются нажатием на кнопки со стрелкой вниз. Когда открыто окно истории, правый клик внутри окна обеспечивает доступ к меню менеджера истории.</p>
<p><span style="font-weight: bold;">3. Массовые замены по списку пользователя: Edit -&gt; Book Cleaner. </span>Book Cleaner тоже полностью юникодный и с RegExp. Кроме того, в него вставлено окно комментария, куда можно записать “кто есть кто”.</p>
<p>Большое число доп. опций Book Cleaner доступно через правый клик. Доступны два правокликовых меню, довольно обширных. Если кликнуть на окно таблицы замен, то появятся опции для манипулирования с таблицей, если же кликнуть на окно комментария &#8211; появится меню для его редактирования.</p>
<p>Также я не поленился написать шесть жизненных примеров для работы с Book Cleaner: load -&gt; 1.bcf, 2.bcf и т.д. Прежде, чем начать работу с Book Cleaner, рекомендую в них разобраться. Для того, чтобы было удобно читать текст комментария к загруженному примеру &#8211; правый клик<br />
-&gt; show in window.</p>
<p>RegExp &#8211; это мощная игрушка, а те, кто в них разобрался &#8211; смогут делать ну очень много. Вообщем, настоятельно рекомендую, разберетесь &#8211; сразу почувствуете разницу. Тем более, что инструмент для экспериментирования теперь под рукой: открываете Find/Replace, отмечаете RegExp, вводите свое выражение, затем find &#8211; и сразу видно результат.</p>
<p>В принципе, в RegExp разобраться несложно, но разработка RegExp-скриптов требует внимательности и тчательной отладки. Поэтому при написании своих файлов для Book Cleaner рекомендуется их отлаживать по строкам. Для этого есть колонка use: применяться будут только те<br />
выражения, где use отмечено.</p>
<p>Ну а тем, кто хочет узнать побольше о RegExp &#8211; подробная справка по его теории и практике доступна через “help -&gt; regular expressions”. Там объединены две справки: русскоязычная &#8211; от Грибова и англоязычная &#8211; от Билла.</p>
<p><span style="font-weight: bold;">4. Ну и для кучи сделал вставку картинок: “Insert -&gt; picture”</span></p>
<p>P.S. Еще в основном окне есть две кнопки, со стрелками вверх и вниз. Это для точного перелистывания страниц.</p>
<p>P.P.S. Да, забыл сказать. Не пользуйте Find/Replace и Book Cleaner в режиме показа невидимых символов (конца строки и nbsp): могут быть сбои.</p>
<p>P.P.P.S. В примерах Book Cleaner файлов про hex-номера написал, а вот про специфику RegExp-поиска русских букв и другой экзотики по hex-номерам &#8211; забыл сказать <img src="http://www.the-ebook.org/forum/images/smiles/icon_sad.gif" border="0" alt="Sad" /> . Это нечасто нужно, но на всякий случай…</p>
<p>Делается так. Курсор ставится перед символом, после чего на второй панели статуса появляется его hex-номер. Если номер содержит меньше 4 цифр &#8211; то впереди добавляются нули. Затем к получившейся цифре добавляется \u и это выражение используется в RegExp.</p>
<p>Например, русская <span style="font-weight: bold;">Ц</span>. На статусе высвечивается <span style="font-weight: bold;">hex: 426</span>. Следовательно, для задания <span style="font-weight: bold;">Ц</span> в RegExp надо использовать <span style="font-weight: bold;">\u0426</span>.</p>
<p>Другой пример: греческая маленькая альфа. На статусе &#8211; <span style="font-weight: bold;">hex: 3b1 </span>. Для RegExp &#8211; <span style="font-weight: bold;">\u03b1</span></p>
<p>Третий пример: двойной интеграл из математической клавиатуры. На статусе &#8211; <span style="font-weight: bold;">hex: 222c </span>. Для  RegExp &#8211; <span style="font-weight: bold;">\u222c</span>.</p>
<p>По поводу юникодной RegExp-специфики довольно подробно расписано в справке от Билла.</p>
<p><img style="vertical-align: middle;" title="Download: OCR Pad" src="http://www.the-ebook.org/rus/wp-content/plugins/wp-downloadmanager/images/drive_go.gif" alt="Download: OCR Pad" /> <a title="Download: OCR Pad" href="http://www.the-ebook.org/rus/?dl_id=29">OCR Pad</a> (3.8 Mb)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bookdesigner.ru/?feed=rss2&amp;p=22</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->