Help:Экспорт в текстовые процессоры
Все статьи в наших MediaWiki можно экспортировать в текстовые процессоры, такие как MS Word или Open Office Writer. Это сделано для того, чтобы потом, добавив небольшую обработку напильником, получить из веб-статьи бумажный, нарезанный на отдельные страницы документ, без всяких вспомогательных навигационных ссылок.
Эта фунциональность вызывается ссылками в левой панели:
- «→M$WORD»
- Экспорт статьи в MS Word.
- «→OOffice»
- Экспорт статьи в OpenOffice. Кстати, если нужен PDF, то проще всего его получить именно из OpenOffice.
Технически, передается обработанный HTML, в котором
- Все ссылки (включая ссылки на изображения) сделаны абсолютными
- Убран всякий навигационный мусор (ну и куча эвристик по мелочи, чтобы осталось только важное для печати, и выглядело прилично)
- Устанавливается Content-Type, такой, чтобы броузер вызвал Word или OpenOffice соответственно.
- Местами вставляется специальные HTML-классы, которые понимает только Word (для реализации счетчиков, хитрого форматирования и т. п.).
Текстовый процессор, открыв этот HTML, по абсолютным ссылкам закачивает в документ картинки. Они остаются «связанными» с хранящимися на сервере, и если обновить картинки на сервере, а затем «обновить связи в документе» — то картинки обновятся.
Если документ надо высылать куда-то, где Wiki недоступна (например, заказчику) — то связи перед этим необходимо разорвать. Разрыв связей выполняется в MS Word 2003 через меню Связи, а в MS Word 2010 через ссылку справа внизу страницы Файл.
В Справке далее упоминаются шаблоны ({{Шаблон}}), они могут быть не во всех wiki-системах — они сознательно не сделаны реплицируемыми чтобы не повредить возможные индивидуальные настройки для конкретных заказчиков. Но при отсутствии — их надо брать из основной wiki.
Contents
Вставка разрыва страницы
{{Word/PageBreak}}
Имеется еще Word/SectionBreak, но он сбрасывает все настройки, в частности, после него имеем не A4, а Letter.
Оглавление, отражаемое в Word
Следующий код, будучи вставленным на вики-страницу, сгенерирует авто-обновляемое поле «Оглавление» для ворда.
{{Word/WordToc}}
Вставка Альбомной страницы
Иногда, например, когда встречается широкая картинка, надо дать понять текстовому процессору, что надо создать страницу с альбомной ориентацией. Это делается с помощью шаблонов:
{{Word/LandscapePageBegin}} Тут собственно содержимое альбомной страницы. {{Word/LandscapePageEnd}}
либо так:
{{Word/SectionBreak}} <div class="SectionLandscape"> Тут собственно содержимое альбомной страницы. </div> {{Word/SectionBreak}}
Нумерация картинок
Если экспорт в Word нужен для публикуемого документа, то часть необходима нумерация картинок. Для этого после каждого рисунка надо ставить вызов шаблона Word/ImgNum
, который породит стандартную центрированную надпись
Рис. @@
При публикации из нее будет сделан номер рисунка. Первым параметром в макрос передается подпись к рисунку, если она не пуста - после номера ставится точка.
Картинка с большим разрешением
Большие картинки, вставляемые обычным образом, при экспорте в word не помещаются на страницу. Чтобы этого избежать, надо вставлять картинку Файл:ИмяКартинки.png шаблоном
{{Word/MaxImg|ИмяКартинки.png}}
При этом картинке устанавливается ширина, равная 16.5 см, чтобы масштабировал word при импорте, а в браузере будет то, что укажешь дополнительными параметрами после имени файла. Если картинка расположена на альбомной странице, или надо задать другую ширину, то это можно сделать параметром w:
{{Word/MaxImg|ИмяКартинки.png|w=25}}
Если картинка имеет такие размеры, что нормально помещается при печати в указанную ширину, то увеличиваться она не будет.
Для картинок, нарисованных в Graphwiz (таг graph
) надо задавать размер size="6.5,10" в случае стандартных полей 3 и 1.5 см.
Колонтитулы
Вот чем хорош ворд, так тем, что своим псевдо-HTML’ем и псевдо-CSS’ом позволяет закодировать почти всё, если вы в нём разберётесь :)
При экспорте из вики по умолчанию подставляется один нижний колонтитул с номером страницы. Первая страница по умолчанию не нумеруется. Но можно задать и собственные колонтитулы, как глобально для всех страниц, так и для отдельной страницы. Для этого сначала нужно получить их HTML-представление.
Делается это так: создаём обычный Word-документ с требуемыми колонтитулами, в нём же нужно сразу задать отдельные колонтитулы для первой и для чётных/нечётных страниц, если таковые требуются. Колонтитулы привязываются к секциям документа, и очень желательно, чтобы Word-документ был маленький и в нём была одна секция, чтобы потом не запутаться в этом мусоре. Дальше нужно сохранить документ как HTML и немного пошаманить. Сохранится он в виде пары файла с именем вида page.htm и папки page.files, в которой будет файл header.htm. Вот он-то нам и нужен. Его нужно открыть блокнотом и скопировать содержимое на обычную страницу Wiki, желательно, с именем, оканчивающимся на «.htm». Кроме того, в скопированном тексте нужно заменить строчку
<meta http-equiv=Content-Type content="text/html; charset=windows-1251">
на строчку
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
Необязательный шаг, можно проделать ради интереса: из скопированного текста можно убрать куски вида <div style='mso-element:footnote-separator' id=fs> ... </div>, у которых id отличается от «h1», «f1», «fh1», «ff1», «eh1», «ef1». Эти аббревиатуры не меняются от документа к документу и означают: «header/footer section 1», «first page header/footer section 1», «even page header/footer section 1». То бишь, именно <div>'ы с этими ID задают текст колонтитулов.
И последнее, что нужно проделать для вставки этих колонтитулов на свою страницу — поместить на неё магический текст:
{{#docexportcss: @page SectionNumbered { mso-first-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") fh1; mso-first-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") ff1; mso-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") h1; mso-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") f1; mso-even-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") eh1; mso-even-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") ef1; } @page SectionLandscape { mso-first-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") fh1; mso-first-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") ff1; mso-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") h1; mso-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") f1; mso-even-header:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") eh1; mso-even-footer:url("{{fullurl: <ИМЯ_СТРАНИЦЫ_С_КОЛОНТИТУЛАМИ.htm> |action=raw&ctype=text%2Fhtml%3B+charset%3Dutf-8}}") ef1; } }}
Глобальные стили экспорта
При большом желании и наличии прав вики-админа можно править глобальные стили экспорта в Word / OpenOffice.
Для этого можно менять страницы MediaWiki:Docexport-word.css и MediaWiki:Docexport-oo.css. Есть ещё MediaWiki:Docexport-word-orig.css и MediaWiki:Docexport-oo-orig.css, но их лучше не трогать и не убирать их включения из первых двух, ибо в этих случаях перестанут приходить обновления стандартных стилей для экспорта.
Магия для вывода текста только при экспорте
Если в статье требуется написать части, видимые только при её просмотре в Wiki, или наоборот — видимые только при экспорте, можно использовать волшебное слово {{DOCEXPORT}}, принимающее значение «1» при экспорте и "" (пустую строку) при просмотре, и функцию парсера {{#if: {{DOCEXPORT}} | Текст для экспорта | Текст для просмотра }}.
Известные проблемы
- Если в статье встречаются картинки с длинными названиями (больше 255 символов в URL-кодировке) — после пересохранения документа в *.doc Word их портит (часть после 255-го символа отрезается). Решение проблемы — сохранять такие документы в *.docx, либо разрывать связи, таким образом вставляя картинки в сам документ.
Расширение MediaWiki
Всё описанное обеспечивается расширением 4intranet:DocExport.