Montrer 

Exclusions de pages web

Marche � suivre pour configurer ce crawler de mani�re � ce qu'il n'importe aucune page web non d�sir�e dans le portail :

  1. Par d�faut, ce crawler applique les recommandations du serveur web concernant le choix des pages int�ressantes pour les crawlers automatis�s. Si vous pr�f�rez ne pas appliquer ces recommandations, d�s�lectionnez l'option Ob�ir aux protocoles automatiques d'exclusion du site destinataire.

    En r�gle g�n�rale, ces recommandations permettent de limiter les analyses d'un contenu jug� ind�sirable dans le portail. Cependant, certains sites proposent des recommandations tr�s strictes. S'il s'av�re que votre crawler n'importe aucun contenu d'un site, essayez de d�sactiver cette option.

  2. Par d�faut, ce crawler enregistre les URL des pages web import�es en fonction de la casse de caract�res utilis�e sur le site d'origine. Pour changer les URL en minuscules, s�lectionnez Convertir toutes les URL en minuscules.

  3. Marche � suivre pour �viter d'importer du contenu venant d'une certaine partie d'un site web ou pour �viter d'importer des pages particuli�res :

  4. Par d�faut, ce crawler n'analyse et n'importe aucune des pages d�sign�es dans les exclusions. Si votre crawler doit partir du lien d'une page exclue pour se rendre sur une page non exclue qui elle-m�me doit �tre import�e, choisissez l'option Analyser les pages exclues, mais ne pas les importer.

  5. Marche � suivre pour limiter l'analyse � une partie d'un site web ou � des pages particuli�res :


  1. Cliquez sur Administration.
  2. Ouvrez l'�diteur de crawler web :
  3. � gauche, sous Modifier les param�tres d'objet, cliquez sur Exclusions de pages web.