Различное поведение в синонимах, мигрирующих от solr 3.6 до 4.0

Я изучаю миграцию от SolR 3.6 до 4.0.

Я разработал крошечную систему больше чем без 2500 документов. Кроме того, я развивал больше чем 4100 тестов, чтобы удостовериться что в каждом изменении, нет ухудшения в функционировании системы.

Для этой миграции я держал настройки по умолчанию Solr 4.0, просто добавив мой собственный тип поля (я видел много новых параметров настройки в schema.xml и solrconfig.xml).

Таким образом, на первом показе без синонимов, различием между версиями 4.0 и 3.6 было просто предложение (фраза это в 4.0 работах лучше, чем 3.6) от 4100. Однако, если я включаю синонимы, отклонение становится намного более очевидным со значительно худшими результатами в 4.0.

Мой тип поля следующие:


  
    
    
    
    
    
    
    
  

  
    
    
    
    
    
    
    
    
  

Файл с синонимами - то же самое в обеих версиях.

Есть ли какое-либо различие между тем, как синонимы используются в 4.0 и 3.6? Я должен определить их по-другому в 4.0?

1
nl ja de
@randroid, afaik рекомендуемая конфигурация должен использовать синонимы в обеих сторонах с условием, что в время индекса используются с expand=true и в время выполнения запроса с expand=false .
добавлено автор asuka, источник
@randroid, afaik рекомендуемая конфигурация должен использовать синонимы в обеих сторонах с условием, что в время индекса используются с expand=true и в время выполнения запроса с expand=false .
добавлено автор asuka, источник
почему вы используете SynonymFilterFactory с обеих сторон (время индекса и время выполнения запроса). Обычно SynonymFilterFactory используется только однажды, или время индекса или время выполнения запроса, но не оба.
добавлено автор randroid, источник
почему вы используете SynonymFilterFactory с обеих сторон (время индекса и время выполнения запроса). Обычно SynonymFilterFactory используется только однажды, или время индекса или время выполнения запроса, но не оба.
добавлено автор randroid, источник
Я не уверен, каково преимущество использования его с обеих сторон.
добавлено автор randroid, источник
Я не уверен, каково преимущество использования его с обеих сторон.
добавлено автор randroid, источник
Например, у нас есть "Телевидение, Телевизоры, ТВ, телевизоры", и мы вносим термин в указатель "ТВ", тогда у индексируемой стоимости будут все 4 условия (Телевидение, Телевизоры, ТВ, телевизоры), теперь когда мы будем искать "ТЕЛЕВИЗОРЫ", во время анализа времени выполнения запроса это выберет первый пункт (Телевидение) от синонимов, поскольку у нас есть expand=false. Если у нас не было synonymFilterFactory во время выполнения запроса, то это будет просто соответствовать термину вопроса, который должен работать, поскольку мы расширили синонимы во время индекса.
добавлено автор randroid, источник
Например, у нас есть "Телевидение, Телевизоры, ТВ, телевизоры", и мы вносим термин в указатель "ТВ", тогда у индексируемой стоимости будут все 4 условия (Телевидение, Телевизоры, ТВ, телевизоры), теперь когда мы будем искать "ТЕЛЕВИЗОРЫ", во время анализа времени выполнения запроса это выберет первый пункт (Телевидение) от синонимов, поскольку у нас есть expand=false. Если у нас не было synonymFilterFactory во время выполнения запроса, то это будет просто соответствовать термину вопроса, который должен работать, поскольку мы расширили синонимы во время индекса.
добавлено автор randroid, источник