Difference between revisions of "TikaMW"

From Wiki4Intranet
Jump to: navigation, search
 
(4 intermediate revisions by the same user not shown)
Line 1: Line 1:
[[TikaMW]] — наше расширение MediaWiki, подключающее для индексации загруженных в Wiki файлов библиотеку [http://tika.apache.org/ Apache Tika]. Tika умеет извлекать текст из бинарных документов различных форматов — MS Office, Open Office, PDF и так далее.
+
{{Extension4info
 
+
|name=TikaMW
* Автор: [[User:VitaliyFilippov|Виталий Филиппов]]
+
|mediawiki=1.10+
* Последнее изменение: 2012-09-04
+
|license=GPLv3.0+
* MediaWiki: 1.10+
+
|description en=Search indexing of binary (MS Office, Open Office, PDF and other) documents uploaded into the Wiki using [http://tika.apache.org/ Apache Tika].
* Лицензия распространения: GPLv3 или более поздняя
+
|description ru=Поисковая индексация содержимого бинарных (MS Office, Open Office, PDF и т.п.) документов, загруженных в вики, с помощью [http://tika.apache.org/ Apache Tika].
* Код: {{cmd|svn checkout http://wiki.4intra.net/svn/mediawiki4intranet/extensions/TikaMW/}}
+
|authors=[[User:VitaliyFilippov]]
 
+
|created=2012-09-03
== Установка ==
+
|version=2012-09-06
 
+
|included=2012-09-04
Нужна Java и собственно, сама tika (tika-app.jar). Оную брать лучше тоже у нас, так как в нашей версии поправлен один баг и добавлена возможность слушать порт не на всех интерфейсах, а только на заданном (например, на 127.0.0.1).
+
|status=our
* Брать тут: http://code.google.com/p/mediawiki4intranet/downloads/detail?name=tika-app-1.2-fix-TIKA709-TIKA964.jar
+
|useful=definitely
* Или тут: http://wiki.4intra.net/public/tika-app-1.2-fix-TIKA709-TIKA964.jar
+
}}
 
+
{{ExtensionFromInfo|lang=en|name=TikaMW}}
Ссылки на баги, поставленные в апстрим по Тике: [https://issues.apache.org/jira/browse/TIKA-709 TIKA-709], [https://issues.apache.org/jira/browse/TIKA-964 TIKA-964].
+
[[Category:Incomplete extension descriptions]]
 
+
Тику нужно прописать в автозапуск на сервере, как-то так:
+
 
+
<pre>java -jar tika-app-1.2-fix-TIKA709-TIKA964.jar -p 127.0.0.1:8072 -t -eutf-8</pre>
+
 
+
Если в вики до этого уже были загруженные файлы, а вы по ним хотите искать — индекс нужно перестроить с помощью:
+
* При использовании стандартного движка: <tt>maintenance/rebuildtextindex.php</tt>.
+
* При использовании [[SphinxSearchEngine]]: <tt>extensions/SphinxSearchEngine/rebuild-sphinx.php</tt>.
+
 
+
[[Category:Extensions]]
+

Latest revision as of 15:53, 22 April 2013

TikaMW is a MediaWiki extension.

Status for Mediawiki4Intranet distribution:

  • Inclusion date: 2012-09-04
  • Included version: newest available
  • Improvement status: Created by MediaWiki4Intranet project