Vous cr�ez un crawler de contenu pour importer du contenu provenant de r�f�rentiels externes dans le portail. Vous devez ex�cuter une t�che associ�e au crawler de contenu pour faire des recherches p�riodiques de contenu dans le r�f�rentiel externe et pouvoir importer ce contenu. Pour en savoir davantage sur les t�ches, consultez la rubrique � propos des t�ches.
Remarque : les crawlers de contenu d�pendent des sources de contenu. Pour en savoir davantage sur les sources de contenu, consultez la rubrique � propos des sources de contenu.
Cette rubrique traite des sujets suivants :
Pour savoir comment cr�er ou modifier des objets administratifs (y compris les crawlers de contenu), cliquez ici.
Un crawler de contenu web permet aux utilisateurs d�importer dans le portail du contenu venant du web.
Pour en savoir davantage sur l��diteur de crawler de contenu web, cliquez sur une des pages de l��diteur ci-dessous :
Un crawler de contenu distant permet aux utilisateurs d�importer dans le portail du contenu venant d�un r�f�rentiel externe.
Alors que certains fournisseurs d�analyse sont install�s avec le portail et � la disposition des utilisateurs du portail, d�autres doivent �tre install�s et configur�s manuellement. Par exemple, Oracle propose les fournisseurs d�analyse suivants :
Remarque : pour savoir comment vous procurer des fournisseurs d�analyse, rendez-vous sur le r�seau Oracle Technology Network � l�adresse http://www.oracle.com/technology/index.html. Pour plus de renseignements sur l�installation des fournisseurs d�analyse, consultez le document Installation Guide for WebCenter Interaction (Guide d�installation de WebCenter Interaction) (disponible sur http://www.oracle.com/technology/documentation/bea.html) ou la documentation qui accompagne votre fournisseur d�analyse, ou contactez l�administrateur de votre portail.
Pour cr�er un crawler de contenu distant :
Pour en savoir davantage sur l��diteur de crawler de contenu distant, cliquez sur une des pages de l��diteur ci-dessous :
Les fournisseurs d�analyse ci-dessous, quand ils sont install�s, comprennent au moins une page suppl�mentaire vers l��diteur de crawler de contenu distant :
Les services web de contenu permettent de sp�cifier les param�tres g�n�raux du r�f�rentiel de contenu distant alors que les param�tres de destination et de s�curit� sont �tablis dans la source de contenu distante et le crawler de contenu distant associ�s. Ceci vous permet d�analyser plusieurs emplacements d�un m�me r�f�rentiel de contenu sans avoir � sp�cifier plusieurs fois les m�mes param�tres.
Remarque : vos sources de contenu distantes reposent sur les services web de contenu que vous cr�ez. Pour en savoir davantage sur les sources de contenu, consultez la rubrique � propos des sources de contenu.
Pour en savoir davantage sur l��diteur du service web de contenu, cliquez sur une des pages de l��diteur ci-dessous :
Les utilisateurs peuvent obtenir un acc�s automatique au contenu import� par certains crawlers de contenu distants. Le tableau de synchronisation ACL g�n�ral indique � ces crawlers de contenu les modalit�s d�importation des param�tres de s�curit� des documents source.
Pour voir un exemple d�importation des param�tres de s�curit�, consultez la rubrique Exemple d�importation des param�tres de s�curit�.
Si votre crawler de contenu n�importe pas le contenu attendu, plusieurs choses sont � v�rifier :
V�rifiez que les filtres des dossiers ex�cutent un filtrage correct du contenu. Pour savoir comment tester vos filtres, consultez la section Test des filtres de la page Param�tres principaux (filtre).
V�rifiez que le crawler de contenu n�a pas plac� de contenu ind�sirable dans le dossier destinataire. Si, par suite du filtrage, un document n�est ventil� dans aucun sous-dossier, il est possible que le crawler de contenu place ce document dans le dossier destinataire. Ce param�trage est d�fini sur la page Param�tres principaux de l��diteur de dossier.
V�rifiez que le crawler de contenu n�a pas plac� de contenu dans le dossier des documents non class�s. Si un document ne peut �tre plac� dans aucun dossier ou sous-dossier destinataire, il est possible que le crawler de contenu place ce document dans le dossier des documents non class�s. Ce param�trage est d�fini sur la page Param�tres avanc�s de l��diteur de crawler de contenu. Si vous disposez des autorisations n�cessaires, vous pouvez afficher le dossier Documents non class�s quand vous modifiez le r�pertoire ou quand vous cliquez sur Administration | S�lectionner un utilitaire | Acc�s aux documents non class�s.
Vous devez au moins disposer de droits de modification sur le dossier destinataire.
En ce qui concerne les crawlers de contenu web, v�rifiez que les protocoles d�exclusion de robot ou que certaines instructions d�exclusion ou d�inclusion n�emp�chent pas le crawler d�importer le contenu escompt�. Ce param�trage est d�fini sur la page Exclusions de pages web de l��diteur de crawler de contenu.
V�rifiez que les informations d�authentification sp�cifi�es dans la source de contenu associ�e permettent au portail d�acc�der au contenu.
Pour plus de d�tails, consultez l�historique des t�ches.