创建内容 crawler 后,可以从外部内容存放库将内容导入至您的门户网站。您必须运行与内容 crawler 关联的作业,以定期搜索外部存放库并查找和导入内容。有关作业的详细信息,请参阅关于作业。
注:内容 crawler 基于内容来源。有关内容来源的信息,请参阅关于内容来源。
此主题讨论以下信息:
要了解如何创建或编辑系统管理对象(包括内容 crawler),请单击此处。
Web 内容 crawler 允许用户从 Web 将内容导入至门户网站。
要了解 Web 内容 Crawler 编辑器,请单击以下编辑器页之一:
远程内容 crawler 允许用户将内容从外部内容存放库导入至门户网站。
一些搜寻提供程序可随门户网站一起安装,并且可随时供门户网站用户使用,但其它提供程序则需要您手动安装和设置。例如,Oracle 提供以下搜寻提供程序:
注:有关获取搜寻提供程序的信息,请查阅 Oracle 技术网络 http://www.oracle.com/technology/index.html。有关安装搜寻提供程序的信息,请参阅 Installation Guide for Oracle WebCenter Interaction(可从 Oracle 技术网络 http://www.oracle.com/technology/documentation/bea.html 获得)或搜寻提供程序随附的文档,或者与门户网站管理员联系。
要创建远程内容 crawler:
要了解远程内容 Crawler 编辑器,请单击以下编辑器页之一:
如果安装了以下搜寻提供程序,它们至少包含一个远程内容 Crawler 编辑器的附加页面:
内容 Web 服务允许您指定远程内容存放库的常规设置,而将目标和安全性设置留在关联的远程内容来源和远程内容 crawler 中进行设置。这使您可以搜寻同一内容存放库的多个位置,而不必重复指定所有设置。
注:您可以创建作为远程内容来源基础的内容 Web 服务。有关内容来源的信息,请参阅关于内容来源。
要了解内容 Web 服务编辑器,请单击以下编辑器页之一:
用户可以自动获得对某些远程内容 crawler 所导入内容的访问权。全局 ACL 同步化映射指定了这些内容 Crawler 如何导入源文档安全性。
有关如何导入安全性的示例,请参阅导入安全性示例。
如果内容 crawler 未导入预期内容,您应该检查以下几个方面:
确保文件夹过滤器能够正确过滤内容。要了解过滤器测试,请参阅“主要设置(过滤器)”页面上的测试过滤器。
确保内容 crawler 未将不需要的内容放入目标文件夹。如果文档未被筛选至任何子文件夹,内容 Crawler 可能会将该文档放入目标文件夹。这取决于文件夹编辑器主要设置页面中的一项设置。
确保内容 crawler 未将内容放入“未分类文档”文件夹。如果无法将某文档放入任何目标文件夹或子文件夹,内容 Crawler 可能会将该文档放入“未分类文档”文件夹。这取决于内容 Crawler 编辑器高级设置页面中的一项设置。如果您权限正确,则可在编辑“目录”时查看“未分类文档”文件夹,或通过单击系统管理|选择实用程序|访问未分类文档查看。
确保您对目标文件夹至少具有编辑权限。
对于 Web 内容 crawler,确保自动排除协议以及任何排除或包含操作不会妨碍内容 crawler 导入预期内容。这取决于内容 Crawler 编辑器网页排除页面中的一项设置。
确保关联内容来源中指定的验证信息允许门户网站访问内容。
更多相关信息,请查看作业历史记录。