关于内容 Crawler

创建内容 crawler 后,可以从外部内容存放库将内容导入至您的门户网站。您必须运行与内容 crawler 关联的作业,以定期搜索外部存放库并查找和导入内容。有关作业的详细信息,请参阅关于作业

注:内容 crawler 基于内容来源。有关内容来源的信息,请参阅关于内容来源

此主题讨论以下信息:

要了解如何创建或编辑系统管理对象(包括内容 crawler),请单击此处

Web 内容 Crawler

Web 内容 crawler 允许用户从 Web 将内容导入至门户网站。

要了解 Web 内容 Crawler 编辑器,请单击以下编辑器页之一:

远程内容 Crawler

远程内容 crawler 允许用户将内容从外部内容存放库导入至门户网站。

一些搜寻提供程序可随门户网站一起安装,并且可随时供门户网站用户使用,但其它提供程序则需要您手动安装和设置。例如,Oracle 提供以下搜寻提供程序:

注:有关获取搜寻提供程序的信息,请查阅 Oracle 技术网络 http://www.oracle.com/technology/index.html。有关安装搜寻提供程序的信息,请参阅 Installation Guide for Oracle WebCenter Interaction(可从 Oracle 技术网络 http://www.oracle.com/technology/documentation/bea.html 获得)或搜寻提供程序随附的文档,或者与门户网站管理员联系。

要创建远程内容 crawler:

  1. 在门户网站计算机或其它计算机上安装搜寻提供程序。
  2. 创建远程服务器
  3. 创建内容 Web 服务(稍后讨论)。
  4. 创建远程内容来源
  5. 创建远程内容 crawler。

要了解远程内容 Crawler 编辑器,请单击以下编辑器页之一:

如果安装了以下搜寻提供程序,它们至少包含一个远程内容 Crawler 编辑器的附加页面:

内容 Web 服务

内容 Web 服务允许您指定远程内容存放库的常规设置,而将目标安全性设置留在关联的远程内容来源和远程内容 crawler 中进行设置。这使您可以搜寻同一内容存放库的多个位置,而不必重复指定所有设置。

注:您可以创建作为远程内容来源基础的内容 Web 服务。有关内容来源的信息,请参阅关于内容来源

要了解内容 Web 服务编辑器,请单击以下编辑器页之一:

导入文档安全性

用户可以自动获得对某些远程内容 crawler 所导入内容的访问权。全局 ACL 同步化映射指定了这些内容 Crawler 如何导入源文档安全性。

有关如何导入安全性的示例,请参阅导入安全性示例

对搜寻结果进行故障排除

如果内容 crawler 未导入预期内容,您应该检查以下几个方面: