论坛网站如何让百度更快收录——互联网论坛收录开放协议

2008-01-30 17:12 来源: www.doumiao.net 作者:小可 网友评论 0 条 浏览次数 126

《互联网论坛收录开放协议》是百度专为论坛网站提供的类似博客网站RSS的功能,使用 《互联网论坛收录开放协议》可以将论坛发布的帖子主动、及时地告知百度搜索引擎,相当于论坛中的帖子被百度搜索引擎订阅,从而让你的论坛更快、更容易被百度搜索引擎收录。

《互联网论坛收录开放协议》是百度网页搜索制定的论坛内容收录标准,论坛网站可将论坛内发布的帖子制作成遵循此开放协议的XML格式的网页供搜索引擎索引,将论坛发布的帖子主动、及时地告知百度搜索引擎。采用了《互联网论坛收录开放协议》,就相当于论坛中的帖子被百度搜索引擎订阅(类似博客网站的RSS),这样网民将有可能在更大范围内更高频率地访问到你网站论坛中的帖子,进而为你的网站带来潜在的流量。

开放协议内容
        下图为遵照《互联网论坛收录开放协议》制作的XML格式的网页XML网页示例: 百度论坛收录

XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。后面的" xmlns:bbs =" http://www.baidu.com/search/bbs_sitemap.xsd"是该xml文件遵守百度《互联网论坛收录开放协议》的声明,如没有该段声明,xml文件不支持下面的<bbs:reply>等语法。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与你联系。
*<updatePeri>——sitemap 更新周期,以小时为单位。搜索引擎将遵照此周期访问该页面,使页面上的内容更及时地被百度 spider 发现。
*<updatetime>——该 xml 文件最近一次的更新时间 。
*<version>——论坛所使用程序的版本。
*<item>——标记每个帖子信息的开始和结束,标记内为单个帖子信息。
*<link>——帖子的 url 地址,即帖子第一页的地址,请尽量去除url中不必要的参数。
<title>——帖子标题。
<pubDate>——帖子主贴的发布时间 。
<bbs:lastDate>——帖子最后一条回复的发布时间 。
<bbs:reply>——帖子总的回复数,不包括主贴。
<bbs:hit>——帖子总的查看次数。
<bbs:mainLen>——帖子主贴的长度,单位字节 。
<bbs:boardid>——帖子所在版面,提供版面的 id 。
<bbs:pick>——是否设为精华,精华标为 1 ,非精华标为 0 。

推荐时间格式:年月日小时分钟秒
如:2005-11-09 10:37  |  2005/11/09 10:37:00  |  2005.11.09 10:37:00  |
       2005年11月09日10时37分00秒  |  Fri, 09 Nov 2005 10:37:00 GMT

《互联网论坛收录开放协议》开放协议说明
1. 一个站点不可以提交多个不同的XML地址,否则可能会被识别为利用《论坛开放协议》作弊。

2. XML文件的大小最大为10M,大于10M的文件百度spider将不能保证正确获取。

3. 无论你的论坛已经被百度spider抓取,还是尚未被百度spider抓取,都可以使用此开放协议。 

4. 《互联网论坛收录开放协议》只是对百度spider原有收录方式的一种协助和有益补充,而不是取代。百度spider不保证一定能收录你提交的全部内容。

5. xml文件生成之后,百度spider将对你提供的数据进行测试和评估。若测试后没有任何问题,将会在一周内正式收录,这时你可以在百度网页搜索框内输入“site:网站域名”查看收录的来自你网站的信息。

6. 你必须严格遵照《论坛开放协议》的各项要求创建XML文件,包括数据格式和数据内容,否则无法成功收录。 RSS订阅地址不符合《互联网视频开放协议》的数据格式要求,你需要重新制作XML文件。

7. 百度spider的程序定周期定向地访问你提供的XML地址,这个周期由你在<updatePeri>标签中设定,百度spider会参考这个值定期地检查你所提供的xml文件是否改变,检查改变的方法是通过发送HEAD请求检查xml文件的Last-Modified或Content-Length是否改变,来决定是否进行抓取。所以请务必确认你的服务器能返回Last-Modified或Content-Length其中一项,并且其值会根据你的xml文件的改变而改变。因此,你应尽量固定的XML地址,而地址上的内容按照更新周期持续更新,若无法更新将失去被收录的意义。当你需要改变XML文件的路径或名称时,请将原页面做301重定向至新页面,或将原页面置为404。

如何使用百度《互联网论坛收录开放协议》?

原文:http://www.baidu.com/search/pageop.htm

搜藏 搜藏    添加到雅虎收藏+    Delicious    收藏到QQ书签


上一篇: 下一篇:

相关主题:视频网站  收录

网友评论