Weitere Informationen zu Crawlern und Inhalts-Crawler-Web-Services finden Sie hier.
So geben Sie den Speicherort des Inhalts-Crawler-Web-Service an, legen Timeouts fest und aktivieren bzw. deaktivieren Crawler, die diesem Web-Service zugeordnet sind:
Unter „Server-Informationen“ können Sie Remote-Server-Zuordnungen für diesen Web-Service erstellen und verwalten:
Der zugeordnete Server wird rechts neben „Remote-Server“ angezeigt und sein Speicherort im Administrationsverzeichnis wird rechts neben „Pfad des Remote-Servers“ dargestellt.
Klicken Sie zum Entfernen der Remote-Server-Zuordnung auf Entfernen.
Geben Sie unter „Einstellungen für Inhalts-Crawler-Web-Service“ den Pfad und das Timeout für diesen Web-Service ein:
Geben Sie im Feld Container-URL den Pfad zum Crawl-Provider ein. Hiermit wird die Navigation durch die Hierarchie des Inhalts im Portal festgelegt. Bei einem zugeordneten Remote-Server wird die Ausgangs-URL links neben dem Feld angezeigt. Sie können entweder einen relativen Pfad eingeben und dabei den Pfad nach der Ausgangs-URL vervollständigen (/myCrawlerWebService/ContainerProvider.asmx) oder einen absoluten Pfad angeben und dabei die Ausgangs-URL ignorieren (http://myServer/myCrawlerWebService/ContainerProvider.asmx).
Geben Sie im Feld Dokumenten-URL den Pfad zum Dokumenten-Provider ein. Hiermit wird festgelegt, wie das Portal Informationen aus einem Dokument dieses Typs abrufen kann. Bei einem zugeordneten Remote-Server können Sie sowohl einen absoluten als auch einen relativen Pfad eingeben.
Geben Sie im Feld Upload-URL den Pfad zum Upload-Provider an, durch den das Portal Informationen zum Kopieren eines Dokuments in das Dokumenten-Repository erhält. Bei einem zugeordneten Remote-Server können Sie sowohl einen absoluten als auch einen relativen Pfad eingeben.
Bei jeder Timeout-Einstellung legen Sie fest,
wie lange das Portal versuchen soll, Inhalt vom Computer abzurufen, der
als Host für den Web-Service eingesetzt wird. Wird vom Host-Rechner bis
zur Überschreitung der Timeout-Zeit kein Inhalt übermittelt, ist der Crawl
fehlgeschlagen.
Geben Sie in jedem Timeout-Textfeld die Dauer der Wartezeit für
das Portal ein. Klicken Sie hierzu in der Dropdown-Liste auf Sekunde(n)
oder Minute(n).
Die Einstellung für das SOAP-Timeout gilt nur für Inhalt, der nicht durch ein Gateway geleitet wird. Sie sollten ein relativ langes Timeout (ca. 90 Sekunden) einstellen, da der Crawler u. U. auch langsame Back-End-Systeme wie z. B. Exchange abfragen muss.
Die Einstellung für das Gateway-Timeout gilt nur für Inhalt, der durch ein Gateway geleitet wird. Sie können hier wahrscheinlich eine etwas längere Dauer als beim SOAP-Timeout einstellen, da durch ein Gateway geleiteter Inhalt häufiger verschlüsselt oder komplexer ist, und der Server mehr Zeit benötigt, um diesen abzurufen.
Unter „Status des Web-Service“ legen Sie fest, was geschieht, wenn ein Benutzer von diesem Web-Service aus einen Crawler ausführen oder ein Dokument einreichen möchte:
Wenn diesem Web-Service das Crawlen von Inhalt ermöglicht werden soll, klicken Sie auf Aktiviert.
Wenn das Crawlen von Inhalt von diesem Web-Service nicht mehr zugelassen und Benutzern eine Meldung angezeigt werden soll, wenn sie Inhalt suchen oder einreichen möchten, klicken Sie auf Deaktiviert mit Meldung und geben Sie den Meldungstext in das entsprechende Feld ein.
Sie können den Status des Web-Service jederzeit ändern. Sie können einen Web-Service zum Beispiel deaktivieren, wenn Sie Wartungsarbeiten am Host-Rechner oder Änderungen am Web-Service vornehmen müssen.
So zeigen Sie die Seite an, auf die sich dieses Hilfethema bezieht: