摘要:Sitemap是一种通知机制,就是通过创建一个文件的方式, 把网站网页的URL提交给搜索引擎,在Sitemap中定义好页面的URL地址、权重、更新频率等。通过把Sitemap提交给搜索引擎,搜索引擎爬虫沿着Sitemap里面的链接地址进行爬行,这就是Sitemap的机制。"
Sitemap是一种通知机制,就是通过创建一个文件的方式,把网站网页的URL提交给搜索引擎,在Sitemap中定义好页面的URL地址、权重、更新频率等。通过把Sitemap提交给搜索引擎,搜索引擎爬虫沿着Sitemap里面的链接地址进行爬行,这就是Sitemap的机制。 普通Sitemap文件的建立如下。通过XML的方式创建Sitemap,这是最常见也是最简单的一种方式。 <urlset xmIns="网页列表地址"> <url> <loc>网址</oc> <lastmod>2015-01-03TO4:20-08:0</astmnod> <changefreq>always</changefreq> <priority>1.0</priority> </url> <url> <loc>网址</loc> <lastmod>2015-01-02T20:20:36Z</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset> 1.百度Sitemap <?xmlversion="1.0"encoding="UTF-8"?> <urlset> <url> <loc>网页地址</loc> <lastmod>2015-01-01</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset> 2.重要字段含义 ● changefreq:指定提交的URL对应页面内容的更新频率,例如,daily.weckdlymonthly、yearly.这个参数用于设置搜索引擎页面变动的频率,即考量是否需要蜘蛛经常爬行并更新网页的内容。 ● lastmod:当前页面内容最后的修改时间,这个参数可以给搜索引擎一个参考,就是时效性的参考,某些内容,特别是咨询类的,搜索引擎会将内容的更新时间作为排序的一个因子。 ● priority:定义页面的权重,权重越高,相对于其他页面,当前页面的优先级越高。 ● <loc></loc>:用<loc>描述具体的链接地址,这里需要注意的是链接地址中的一些特殊字符必须转换为XML(HTML)定义的转义字符,简化版的Sitemap也可以采用记事本方式,就是直接打开一个记事本,然后把URL填入,每个URL一行,然后直接提交搜索引攀,也能实现同样的目的。 3.超级门户的Sitemap模式 搜索引擎并不限定每个网站提交的Sitemap文件的个数,因此,如果网页URL条目比较多,可以对新增的页面进行差额提交。 在创建多个Sitemap文件时,可以通过一个父Sitemap文件链接多个子Sitemap文件,子Sitemap文件通过填充实际URL条目的模式完成这样可以确保部个文件的U条日不会特别多,建设一个Sitemap文件的URL条目不要超过1000个。 提交Sitemap的方式有多种,通常的做法是创建百度或者其他搜索引擎的站长账户,然后在站长后台把Sitemap的URL提交上去,在站长后台可以看到每个Sitemap的处理进度和收录的数据。网站式行业动态
版权声明:除特别声明外,本站所有文章皆是本站原创,转载请以超链接形式注明出处!