No está muy claro tu requerimiento. Me llama la atención que mencionas que tienes gran cantidad de archivos, me gustaría saber de que cantidad estamos hablando exactamente ya que no es lo mismo un sistema para procesar Terabytes que para procesar Megabytes.
Tengo mucha experiencia utilizando librerías para procesamiento de gran variedad de formatos de archivos en Java, en tu caso son XML lo que estoy entiendo que quieres procesar/consultar/manipular.
Si pudieras describir con más detalle cual es la problemática a la que te enfrentas en la vida real, que información es la que contienen estos archivos (noticias, investigaciones, facturas) y todo el detalle que me pudieras proporcionar se agradece.
De mi parte comentarte que me interesa el proyecto y cualquier duda o comentario de esta propuesta, a tus órdenes.
Saludos