Erstellen Sie einen Inhalts-Crawler, um Inhalt aus externen Inhalts-Repositories in Ihr Portal zu importieren. Sie müssen einen dem Inhalts-Crawler zugeordneten Auftrag ausführen, um im externen Repository regelmäßig nach Inhalt zu suchen und diesen Inhalt zu importieren. Weitere Informationen zu Aufträgen finden Sie unter Infos zu Aufträgen.
Hinweis: Inhalts-Crawler sind von Datenquellen abhängig. Weitere Informationen zu Inhaltsquellen finden Sie unter Infos zu Inhaltsquellen.
In diesem Thema werden die folgenden Bereiche behandelt:
Weitere Informationen zum Erstellen oder Bearbeiten von Administrationsobjekten (einschließlich Inhalts-Crawler) finden Sie hier.
Web-Inhalts-Crawler ermöglichen Benutzern das Importieren von Inhalt aus dem Internet in das Portal.
Weitere Informationen zum Editor für Web-Inhalts-Crawler finden Sie auf den folgenden Editor-Seiten:
Mit einem Remote-Inhalts-Crawler lässt sich Inhalt aus einem externen Inhalts-Repository in das Portal importieren.
Einige Crawl-Provider werden direkt mit dem Portal installiert und stehen Portalbenutzern sofort zur Verfügung, andere müssen erst manuell installiert und eingerichtet werden. Die folgenden Crawl-Provider werden beispielsweise von Oracle bereitgestellt:
Hinweis: Informationen über den Bezug von Crawl-Providern finden Sie im Oracle Technology Network unter http://www.oracle.com/technology/index.html. Informationen zum Installieren von Crawl-Providern finden Sie im Installation Guide for Oracle WebCenter Interaction (verfügbar im Oracle Technology Network unter http://www.oracle.com/technology/documentation/bea.html), in der Dokumentation des Crawl-Providers oder direkt von Ihrem Portal-Administrator.
So erstellen Sie einen Remote-Inhalts-Crawler:
Weitere Informationen zum Editor für Remote-Inhalts-Crawler finden Sie auf den folgenden Editor-Seiten:
Folgende Crawl-Provider fügen dem Editor für den Remote-Inhalts-Crawler zumindest eine zusätzliche Seite hinzu, wenn sie installiert werden:
Inhalts-Web-Services ermöglichen Ihnen das Festlegen von allgemeinen Einstellungen für Ihr Remote-Inhalts-Repository. Die Einstellungen für Ziel und Sicherheit werden dann in der zugeordneten Remote-Inhaltsquelle und im Remote-Inhalts-Crawler eingerichtet. So können Sie mehrere Bereiche desselben Inhalts-Repository durchsuchen, ohne die Einstellungen immer wieder neu angeben zu müssen.
Hinweis: Die von Ihnen erstellten Inhalts-Web-Services dienen als Grundlage für Ihre Remote-Inhaltsquellen. Weitere Informationen zu Inhaltsquellen finden Sie unter Infos zu Inhaltsquellen.
Weitere Informationen zum Editor für den Inhalts-Web-Service finden Sie auf den folgenden Editor-Seiten:
Benutzer können automatisch Zugriff auf den von bestimmten Remote-Inhalts-Crawlern importierten Inhalt erhalten. Die globale ACL Sync-Zuordnung zeigt diesen Inhalts-Crawlern, wie Sicherheitseinstellungen von Quelldokumenten importiert werden sollen.
Ein Beispiel zum Importieren von Sicherheitseinstellungen finden Sie unter Beispiel für das Importieren von Sicherheitseinstellungen.
Sie sollten Folgendes überprüfen, wenn Ihr Inhalts-Crawler nicht den gewünschten Inhalt importiert:
Vergewissern Sie sich, dass die Filter in Ihren Ordnern richtig eingestellt sind. Informationen zum Testen Ihrer Filter finden Sie auf der Seite "Haupteinstellungen (Filter)" im Abschnitt Testen von Filtern.
Vergewissern Sie sich, dass der Inhalts-Crawler keinen unerwünschten Inhalt im Zielordner abgelegt hat. Werden Dokumente nicht in Unterordner gefiltert, legt der Inhalts-Crawler sie möglicherweise im Zielordner ab. Dies wird durch eine Einstellung auf der Seite Haupteinstellungen im Ordner-Editor festgelegt.
Vergewissern Sie sich, dass der Inhalts-Crawler keinen unerwünschten Inhalt im Ordner "Nicht klassifizierte Dokumente" abgelegt hat. Können Dokumente weder in den Ziel- noch in den Unterordnern abgelegt werden, verschiebt der Inhalts-Crawler diese unter Umständen in den Ordner "Nicht klassifizierte Dokumente". Dies wird durch eine Einstellung auf der Seite Erweiterte Einstellungen im Inhalts-Crawler-Editor festgelegt. Wenn Sie über die entsprechenden Berechtigungen verfügen, können Sie den Ordner "Nicht klassifizierte Dokumente" beim Bearbeiten des Verzeichnisses oder durch Klicken auf Administration | Dienstprogramm auswählen | Auf nicht klassifizierte Dokumente zugreifen anzeigen.
Stellen Sie sicher, dass Sie mindestens über die Bearbeitungsberechtigung für den Zielordner verfügen.
Bei Web-Inhalts-Crawlern müssen Sie auch darauf achten, dass keine automatischen Ausschlussprotokolle oder andere Ausschlüsse bzw. Aufnahmen den Inhalts-Crawler am Importieren des erwarteten Inhalts hindern. Dies wird durch eine Einstellung auf der Seite Ausschluss von Webseiten im Inhalts-Crawler-Editor festgelegt.
Außerdem müssen die in der zugeordneten Inhaltsquelle angegebenen Authentifizierungsinformationen dem Portal einen Zugriff auf den Inhalt ermöglichen.
Im Auftragsverlauf finden Sie dazu weitere Informationen.