Se necesita automatizar la indexación de nutch en solr dentro de una colección ya existente.
Dentro de los portales WEB a indexar esta wikipedia la cual se hace de manera diferente a los demás sitios.
Todo montado sobre Ubuntu con solr-4.10.1y nutch-1.12.
Puede proponer otra manera de hacerlo siempre y cuando se logre automatizar el proceso y realizar consultas desde otro servidor