Erweiterte Einstellungen (Inhalts-Crawler)

So legen Sie die Sprache des Inhalts, die Vorgehensweise f�r abgelehnte Dokumente sowie den Inhalts-Crawler-Tag fest:

  1. W�hlen Sie unter "Sprache des Inhalts" in der Dropdown-Liste die Sprache aus, in der der Gro�teil des zu importierenden Inhalts verfasst ist.

  2. Geben Sie unter "Abgelehnte Dokumente" an, wie mit Dokumenten verfahren werden soll, die nicht erfolgreich in einen Ordner einsortiert werden konnten:

  3. Wenn Sie einen vorhandenen Inhalts-Crawler bearbeiten, sehen Sie unter "Abgelehnte Dokumente" zus�tzliche Optionen, �ber die Sie angeben k�nnen, was geschehen soll, wenn der Inhalts-Crawler ein bereits abgelehntes Dokument findet. Die Definition von "bereits abgelehnt" h�ngt von der in Schritt 4b ausgew�hlten Option ab:

  4. Geben Sie an, wie mit bereits abgelehnten Dokumenten verfahren werden soll:

    Falls es unbedingt notwendig ist, k�nnen Sie den Verlauf bereits abgelehnter Dokumente l�schen. Die Definition von "bereits abgelehnt" h�ngt auch hier von der in Schritt 4b ausgew�hlten Option ab: Wenn Sie in Schritt 4b "Aus dieser Inhaltsquelle" gew�hlt haben, l�schen Sie den Ablehnungsverlauf f�r alle Inhalts-Crawler, die Dokumente aus dieser Inhaltsquelle importieren. Wenn Sie sicher sind, dass Sie den Verlauf bereits abgelehnter Dokumente l�schen m�ssen, klicken Sie auf Den Ablehnungsverlauf l�schen.

    Hinweis: Wenn sich ein Dokument nicht einsortieren l�sst, wird es im Ordner "Nicht klassifizierte Dokumente" abgelegt. Das bedeutet jedoch nicht, dass das Dokument abgelehnt wurde. Abgelehnte Dokumente sind Dokumente, die in keinem Ordner abgelegt wurden.

  5. Wenn Sie einen vorhandenen Inhalts-Crawler bearbeiten, wird der Bereich "Dokumente werden importiert" angezeigt. Legen Sie unter "Dokumente werden importiert" fest, ob nur neue Dokumente importiert werden sollen. Standardm��ig importiert dieser Inhalts-Crawler nur neue Dokumente (die noch nicht durch diesen Inhalts-Crawler oder andere Inhalts-Crawler, die auf die gleiche Inhaltsquelle zugreifen, importiert wurden). Sie k�nnen die Inhalts-Crawler-Einstellungen �ndern, sodass mehrere Exemplare jedes Dokuments importiert werden. Dies kann beim Testen der Inhalts-Crawler n�tzlich sein.

    1. Wenn nur neue Dokumente importiert werden sollen, w�hlen Sie Nur neue Links importieren aus. Daraufhin werden weitere Optionen angezeigt. Andernfalls fahren Sie mit Schritt 5 fort.

    2. So legen Sie fest, was als neuer Link definiert wird:

    3. Hinweis: Die hier ausgew�hlte Option wirkt sich auch auf die Aktionen in Schritt 3 und Schritt 4f aus.

    4. W�hlen Sie Option Die Dokumente aktualisieren, um die anhand der Einstellungen auf der Seite Dokumenteinstellungen importierten Dokumente zu aktualisieren. Im Allgemeinen ist das Aktualisieren von Dokumenten die Aufgabe des Dokumentenaktualisierungs-Agenten. Durch das Aktualisieren wird der Inhalts-Crawler verlangsamt. Wenn Sie jedoch die Dokumenteinstellungen f�r diesen Inhalts-Crawler oder die Eigenschaftszuordnungen in den zugeordneten Inhaltstypen ge�ndert haben, werden diese Einstellungen durch das Aktualisieren auch f�r die vorher importierten Dokumente �bernommen.

      Hinweis:
      Wenn der Crawl an einem RSS-Feed durchgef�hrt wird, werden durch die Option diese aktualisieren die Eigenschaften (u. a. Titel und Beschreibung) mit den Werten aus den Zieldokumenten, nicht aus dem RSS-Feed aktualisiert. Wenn Sie die Eigenschaften aus dem RSS-Feed beibehalten m�chten, w�hlen Sie nicht diese aktualisieren.

    5. Falls Sie zus�tzliche Ordner erstellt oder unterschiedliche Filter auf die Zielordner angewendet haben, w�hlen Sie die Dokumente in zus�tzliche Ordner einordnen. Dadurch werden die bereits importierten Dokumente in neue Wissensverzeichnis-Ordner einsortiert.

      M�glicherweise hat ein anderer Inhalts-Crawler bereits Dokumente aus derselben Inhaltsquelle importiert, dabei jedoch andere Ordner als die f�r diesen Inhalts-Crawler angegebenen Zielordner verwendet. Vergewissern Sie sich, ob Sie diese Dokumente wirklich in die f�r diesen Inhalts-Crawler festgelegten Zielordner umsortieren m�chten.

    6. Sollen Dokumente neu importiert werden, die vorher gel�scht wurden (manuell, durch Ablauf der G�ltigkeit oder wegen fehlender Quelldokumente), w�hlen Sie Gel�schte Links wiederherstellen. Dadurch werden u. U. Dokumente erneut importiert, die zu einem anderen Zeitpunkt als ungeeignet f�r das Portal eingestuft wurden.

    7. Falls es unbedingt notwendig ist, k�nnen Sie den Verlauf von Dokumenten l�schen, die aus dem Portal entfernt wurden. "Verlauf" wird durch die Einstellungen festgelegt, die Sie in Schritt 3b f�r neue Dokumente vorgenommen haben:

    8. Wenn Sie immer noch davon �berzeugt sind, dass Sie die Datens�tze der aus dem Portal gel�schten Dokumente wirklich l�schen m�ssen, klicken Sie auf L�schverlauf l�schen.

  6. Wenn Sie importierte Dokumente mit einem Inhalts-Crawler-Tag kennzeichnen m�chten, geben Sie einen Tag in das Feld Importierte Dokumente mit dem folgenden Inhalts-Crawler-Tag markieren ein. Dieser Tag dient zur Unterscheidung der Dokumente, die durch diesen Inhalts-Crawler importiert wurden, von den Dokumenten, die durch andere Inhalts-Crawler importiert wurden.

  7. Stellen Sie unter "Laufzeitkonfiguration" Folgendes ein:

  8. Die zul�ssigen Bereiche f�r diese Felder werden in der Portal-Konfigurationsdatei festgelegt. Die hier eingestellten Werte werden auch durch die maximale Anzahl der Threads begrenzt, die im f�r diesen Inhalts-Crawler-Auftrag verwendeten Automation Service zul�ssig sind.


  1. Klicken Sie auf Administration.
  2. �ffnen Sie den Editor f�r den Inhalts-Crawler:
  3. Klicken Sie links unter "Objekteinstellungen bearbeiten" auf Erweiterte Einstellungen.