Find Jobs
Hire Freelancers

273163 Project for loker

N/A

En curso
Publicado hace más de 15 años

N/A

Pagado a la entrega
C++ Crawler able to index/reindex pages and download content making xml file for each page. Here are main requirements: * Can be scheduled * The Agent can accept multiple crawl start locations per web site * Support for [login to view URL] * Forbiden string in url (for example do not follow ?, %, or keyword) * Can leave domain / do not leave domain * Max pages per domain (user input) * The agent can support exclusions of files beyond that of the servers standard [login to view URL] * Specify how many levels deep to follow links for starting location crawl * Multi-Threaded for Concurrent Scans * Reindexing New Files or Modified Files Only * Complete Cache Management * Download to specific storage (web, news) * Download Title, Description, Keywords, Page content, Add the following fields: date indexed, Page size, url * Make XML file for each downloaded page with the info above ------------------------------------------------------------------- * Web based administration * List of url's to crawl * Start/Stop/Hold/Continue * Scheduled time index/reindex for specific storage and list of sites * File type: html based (html, htm, php, asp, js, do ...)
ID del proyecto: 2019447

Información sobre el proyecto

Proyecto remoto
Activo hace 12 años

¿Buscas ganar dinero?

Beneficios de presentar ofertas en Freelancer

Fija tu plazo y presupuesto
Cobra por tu trabajo
Describe tu propuesta
Es gratis registrarse y presentar ofertas en los trabajos

Sobre este cliente

Bandera de CYPRUS
Nicosia, Cyprus
5,0
2
Miembro desde ene 17, 2009

Verificación del cliente

¡Gracias! Te hemos enviado un enlace para reclamar tu crédito gratuito.
Algo salió mal al enviar tu correo electrónico. Por favor, intenta de nuevo.
Usuarios registrados Total de empleos publicados
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Cargando visualización previa
Permiso concedido para Geolocalización.
Tu sesión de acceso ha expirado y has sido desconectado. Por favor, inica sesión nuevamente.