要了解 crawler 和内容 Web 服务,请单击此处。
要指定内容 Crawler Web 服务的位置,指定超时,启用或禁用与此 Web 服务关联的 crawler:
在"服务器信息"下,您可以为此 Web 服务建立并管理远程服务器关联:
所关联的远程服务器将显示在"远程服务器"的右侧,该远程服务器在系统管理目录中的位置将显示在"远程服务器路径"的右侧。
要移除远程服务器关联,请单击移除。
在"内容 Crawler Web 服务设置"下,指定此 Web 服务的路径和超时设置:
在容器 URL 框中,输入搜寻提供程序的路径,告知门户网站如何在分层内容中定位。如果已关联远程服务器,基本 URL 即会显示在框的左侧。您可以键入相对路径,完成以基本 URL 开始的路径即可 (/myCrawlerWebService/ContainerProvider.asmx);也可以键入绝对路径,忽略基本 URL (http://myServer/myCrawlerWebService/ContainerProvider.asmx)。
在文档 URL 框中,键入文档提供程序的路径,以确定门户网站如何从此类型的文档中获取信息。如果已关联远程服务器,您可以键入相对路径或绝对路径。
在上载 URL 框中,键入上载提供程序的路径,告知门户网站如何将文档复制到文档存放库。如果已关联远程服务器,您可以键入相对路径或绝对路径。
对于每个超时设置,指定想要门户网站尝试从托管 Web 服务的计算机中获取内容的时间。如果主机计算机在超时周期结束之前未返回内容,则搜寻失败。
在每个超时文本框中,键入想要门户网站等待的秒数或分钟数;然后在下拉列表中单击秒或分钟。
SOAP 超时设置仅适用于未设置网关的内容。您可能要设置相对较长的超时(可能为 90 秒),因为 crawler 可能需要联系慢速后端系统(例如,Exchange)。
网关超时设置仅适用于已设置网关的内容。您可以在此处设置比 SOAP 超时稍长的时间,因为设置网关的内容经常受到保护或结构更复杂,因此您要允许服务器有更多时间尝试获取内容。
在"Web 服务状态"下,指定当用户尝试通过此 Web 服务运行 crawler 或提交文档时发生的情况:
要允许此 Web 服务搜寻内容,请单击已启用。
要禁止此 Web 服务搜寻内容,并在用户试图搜寻或提交内容时向用户显示消息,请单击禁用并显示消息,然后在框内键入消息。
您可以随时切换此 Web 服务的状态。例如,如果您需要对主机或 Web 服务自身执行维护,则可能要禁用 Web 服务。
要显示与此帮助主题相关的页面: