一個規(guī)范的網(wǎng)站,網(wǎng)站地圖肯定是少不了的。一個單獨的網(wǎng)站地圖頁面不僅可以讓用戶對整個網(wǎng)站的目錄結構及內容有一個很好的認識且一目了然,而且方便百度蜘蛛跟蹤連接爬行到網(wǎng)站所有主要部分內容。
網(wǎng)站地圖主要有兩種:
HTML網(wǎng)站地圖
下面我們一個個來學習這兩種網(wǎng)站地圖。
HTML網(wǎng)站地圖
HTML版本的網(wǎng)站地圖主要是給用戶看的,主要列出了網(wǎng)站上所有主要連接的頁面。特指HTML版本網(wǎng)站地圖英文是sitemap,其中s需要小寫。
小規(guī)模網(wǎng)站,其網(wǎng)站地圖可以列出網(wǎng)站上所有的頁面。
規(guī)模稍大的網(wǎng)站,一個網(wǎng)站地圖列出所有頁面不是很現(xiàn)實??梢灾涣谐鼍W(wǎng)站上主要連接(一級分類,二級分類)。也可以將網(wǎng)站地圖分成多個文件,主網(wǎng)站地圖列出通往次級網(wǎng)站地圖的連接,次級網(wǎng)站地圖在列出一部分頁面連接。這樣,多個網(wǎng)站地圖頁面加一起,就可以列出所有或絕大部分重要頁面了。
如果有一個良好的導航系統(tǒng)或者鏈接結構的網(wǎng)站,不一定要列出完整所有頁面的網(wǎng)站地圖。其實,網(wǎng)站地圖和分類結構大同小異。
XML版本網(wǎng)站地圖主要是給搜索引擎看的,由XML標簽組成,該文件必須是utf8編碼。實際上,就是列出網(wǎng)站要被收錄的頁面鏈接。特指XML版本網(wǎng)站地圖英文是Sitemap,其中s通常是大寫。
簡單的可以是一個文本文件,列出頁面的鏈接,一行一個,這樣搜索引擎就能理解和抓取文件的內容了。
標準的文件如下:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://wxlpsy.com/category-2.html</loc>
<lastmod>2016-11-07</lastmod>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>
標簽解讀
urlset:聲明文件所使用的Sitemap協(xié)議版本,是必須要的標簽
url:是它下面所有網(wǎng)址的母標簽,是必須要的標簽
loc:列出頁面完整的url,是必須要的標簽
lastmod:表示頁面最后一次更新時間,此標簽可選。
priority:可選標簽,表示鏈接的相對重要程度
changefreq:代表文件的更新頻率,是可選標簽??梢杂幸韵轮担?
changefreq標簽值
always:表示一直變動,指每次訪問頁面內容都不同
hourly:每小時
daily:每天
weekly:每周
monthly:每月
yearly:每年
never:從不改變
設置頻率更新值是給搜索引擎一個參考。但是,搜索引擎不一定就認為更新頻率就如站長設置的一樣。
最多可以列出5w個URL,且文件大小不能超過10MB。
如果網(wǎng)站要收錄的URL太多,可以分成多個網(wǎng)站地圖文件。
一個網(wǎng)站最多可以有1000個文件,可以列出5000w個網(wǎng)址。
可以通過站長工具后臺提交,百度、360、google都支持該功能。另一種可以放到robots.txt 文件了通知搜索引擎,如下:
Sitemap: http://xnpbm.cn/sitemap.xml
主流的搜索引擎都支持robots文件制定網(wǎng)站地圖文件位置。