要了解内容 crawler 和内容 Web 服务,请单击此处。
要指定此内容 crawler 所导入文档的目标文件夹和安全性:
注:根据要创建的远程内容 crawler 的类型,可能会看到其他设置。要查看这些设置的联机帮助,请单击相关页面的帮助按钮。
在“目的地文件夹”下,指定要将内容导入到哪些文件夹。内容 crawler 尝试将它找到的每个文档的链接导入至目的地文件夹内允许传递该链接的最底层子文件夹。单击此处可获取显示内容 crawler 如何确定将内容导入哪些文件夹的流程图。
要添加目标文件夹,请单击添加文件夹;然后在“选择文件夹”对话框中,选择要添加的文件夹并单击确定。要搜寻文档并将其导入到文件夹,您必须对该文件夹至少具有编辑权限。
要移除某个文件夹,请选择该文件夹,然后单击 。
要选中或清除所有文件夹复选框,请选中或清除文件夹路径左边的复选框。
要切换文件夹的排序顺序,请单击文件夹路径,或者单击右边的 (按升序排序 a-z)或
(按降序排序 z-a)图标。
如果此内容 crawler 所使用的内容 Web 服务支持文件夹镜像(在内容 Web 服务编辑器的高级设置页面中指定),您可以通过选中镜像来源文件夹结构,使得此内容 crawler 创建目录文件夹,来复制要搜寻的内容存放库的文件夹结构。
注:
如果镜像文件夹结构并导入每个文档的安全性信息(如步骤 5 所述),则将为镜像的文件夹导入文件夹安全性。
如果镜像文件夹结构,则在后续运行中,内容 crawler 将移除无对应来源文件夹的任何门户网站文件夹。鉴于此,如果您定期运行此内容 crawler,则任何人都不应以任何方式修改被镜像的门户网站文件夹或文档。
创建此内容 crawler 后,不能更改镜像设置。也就是说,如果设置此内容 crawler 镜像文件夹结构,则以后将不能编辑此设置。
为要求文档在导入至目的地文件夹前通过这些文件夹的过滤器,请选择应用目的地文件夹过滤器。默认情况下,文档无需通过目的地文件夹过滤器,因此所有文档都将导入至所有目的地文件夹。
注: 如果已镜像来源文件夹结构,此功能将不可用。
要将所有导入的文档接受到门户网站中并立即供用户使用,请选择自动核准导入的文档。默认情况下,文档需要经过核准。这表示在导入文档的链接可供用户使用前,它必须由至少对目的地文件夹具有编辑权限的门户网站管理员进行核准。
如果要镜像文件夹结构,您可能需要将导入文档设置为自动进行核准,并将用户权限限制为读取权限(管理员用户组中的用户始终具有系统管理访问权)。如果将导入文档设置为要求核准,则应注意,任何具有编辑以上权限的门户网站管理员也可以修改文件夹和内容,从而使门户网站文件夹和内容与来源存放库失去同步。
如果此内容 crawler 所使用的内容 Web 服务支持安全性导入,而且来源存放库的用户和用户组与门户网站的用户和用户组(在全局 ACL 同步化映射中指定)相对应,则您可以通过选择导入每个文档的安全性,使此内容 crawler 导入每个文档的安全性设置。这样,对来源存放库用户可用的文档也自动对映射的门户网站用户可用。
注:由于读访问权在来源存放库和门户网站中是对等的,而写访问权则不然,因此仅导入读访问权;写访问权将被忽略。(对外部存放库中文档的写访问权允许编辑文档,而门户网站中的写访问权(称为编辑权限)则允许编辑该文档的属性和安全性设置。)
在“文档访问权限”下,您可以执行以下操作,向用户和用户组手动授予此内容 crawler 所导入内容的访问权:
要显示与此帮助主题相关的页面: