Получение ExtractingRequestHandler для работы в Solr

Я пытаюсь заставить Solr работать с Tika, чтобы я мог индексировать документы Word и PDF на моем веб-сайте Drupal.

Я просмотрел страницу Wiki и этот страница , и они указывают на добавление requestHandler в файл solrconfig.xml.

Я сделал это, и теперь Solr выдает исключение:

org.apache.solr.common.SolrException: ошибка загрузки класса 'org.apache.solr.handler.extraction.ExtractingRequestHandler'

Я сделал некоторые поиски и увидел, что у других была эта проблема, но не вижу легкого решения. Я использую Solr 3.4.0 на Windows Server 2003 . Любые идеи о том, как разрешить это?

В качестве побочной заметки у меня есть Drupal с помощью Solr для поиска, и это работает. Но я не могу работать, это иметь документы PDF и Word Solr. Я уверен, что это обычная потребность для большинства веб-сайтов, но я потратил на это дни, и я не могу поверить, что это плохо документировано, и это трудно понять.

4

1 ответы

Если вы запускаете Solr из каталога примеров с установкой причала, он должен работать без изменений.

Однако для многоядерной настройки вам нужно будет скопировать банки в каталог lib .

Если вы проверите файл solrconfig в папках примеров, он включает банки для библиотек solr cell и извлечения.

solrconfig.xml -

Раскомментируйте эту строку, чтобы включить все библиотеки lib -


Скопируйте банки из этих папок в вашу многоярусную папку lib. Эти банки используются для извлечения. (Apache pdfbox, poi, fontbox и т. Д.)



Когда вы запустите Solr, вы увидите все загруженные банки. Должен заставить вас работать.

4
добавлено
В моей установке мне нужно было использовать и NOT
добавлено автор Cole W, источник
прохладный .. большой ...
добавлено автор Jayendra, источник
Я скопировал файл solrconfig.xml в Solr с помощью файла solrconfig.xml от Drupal, чтобы заставить Solr работать с Drupal. Один из Drupal не содержал эти строки lib, поэтому это определенно проблема. Благодаря!
добавлено автор John81, источник
Привет @Jayendra Я не могу настроить эти chnages, можете ли вы объяснить, какие файлы мне нужно скопировать. У меня нет никакой папки dist в моей установке solr
добавлено автор Prafful Garg, источник