SharePoint發(fā)行版本有SharePoint2003、SharePoint2007、Sharepoint 2010、SharePoint2013和SharePoint2016。SharePoint提供了功能強(qiáng)大的團(tuán)隊(duì)協(xié)作環(huán)境,使得組織能夠在整個(gè)組織內(nèi)部實(shí)現(xiàn)整合、組織、查找和提供 SharePoint站點(diǎn)。 SharePoint的搜索著實(shí)強(qiáng)大,而且最近用到SharePoint搜索第三方爬網(wǎng),感覺收獲挺大,而且網(wǎng)上資料沒找到太多類似的,就小記錄一下,分享給大家。 ????? 首先,我自己寫了一個(gè)net頁(yè)面,里面讀取所有我需要內(nèi)容,充當(dāng)SharePoint爬網(wǎng)的數(shù)據(jù)源,對(duì)這個(gè)頁(yè)面進(jìn)行爬網(wǎng),頁(yè)面如下圖: ????? 然后,打開SharePoint管理中心,搜索設(shè)置,新建內(nèi)容源Crawl,爬網(wǎng)http://moss:9000,如下圖。爬網(wǎng)設(shè)置可以按照自己的需要進(jìn)行設(shè)置,比如想要爬網(wǎng)頁(yè)面深度,可以進(jìn)行設(shè)置,我的爬網(wǎng),只是爬網(wǎng)頁(yè)面下面的鏈接,所以深度設(shè)置為1;設(shè)置完成,先不要爬網(wǎng),還需要設(shè)置爬網(wǎng)規(guī)則。 設(shè)置爬網(wǎng)規(guī)則: ????? 打開爬網(wǎng)規(guī)則,設(shè)置路徑,我的路徑是9000端口下的所有頁(yè)面,所以設(shè)置為http://moss:9000/*,當(dāng)然,你的規(guī)則應(yīng)該按照需要進(jìn)行設(shè)置,可以排除這些路徑,也可以包含這些路徑,同時(shí),如果有爬網(wǎng)到的任何結(jié)果,都可以在這里進(jìn)行排除。 ????? 特別的是,我的頁(yè)面上的鏈接,包含“?”問號(hào),所以勾選了對(duì)復(fù)雜的URL進(jìn)行爬網(wǎng),下面的指定認(rèn)證,可以選擇認(rèn)證的賬號(hào),如果需要Form認(rèn)證的網(wǎng)頁(yè),可以設(shè)置指定其他內(nèi)容訪問賬戶【特別:如果登錄需要驗(yàn)證碼的,SharePoint是無(wú)法爬網(wǎng)的】。設(shè)置完爬網(wǎng)規(guī)則,點(diǎn)擊確定保存,然后可以對(duì)Crawl內(nèi)容源進(jìn)行完全爬網(wǎng)了。 對(duì)Crawl內(nèi)容源進(jìn)行完全爬網(wǎng),查看爬網(wǎng)日志,如下圖:? 在SharePoint搜索頁(yè)面上,試試搜索剛配置的內(nèi)容源,如下圖: 搜索結(jié)果: 注意事項(xiàng): 1、? 如果,服務(wù)器處于代理訪問網(wǎng)站的情況,需要配置管理中心的代理,位置在 搜索管理 - 代理服務(wù)器和超時(shí) -? 管理中心URL/_admin/searchfarmsettings.aspx 2、? 搜索爬網(wǎng)內(nèi)容,可能會(huì)出現(xiàn)異常情況,可以嘗試重置搜索內(nèi)容,位置在 搜索管理 - 重置所有已爬網(wǎng)內(nèi)容,重置一下搜索結(jié)果。 3、? 爬網(wǎng)結(jié)果,搜索出來的結(jié)果,標(biāo)題為搜索頁(yè)面的Html的頁(yè)面Title,內(nèi)容為頁(yè)面上的Body內(nèi)容,鏈接為URL。 4、? 同樣的搜索配置,可以搜索新浪,搜狐等網(wǎng)站。 Sharepoint 可以幫助企業(yè)用戶輕松完成日常工作。 |
溫馨提示:喜歡本站的話,請(qǐng)收藏一下本站!