《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的视频主动、及时地告知百度搜索引擎。采用了《互联网新闻开放协议》,就相当于网站的新闻被百度新闻搜索引擎订阅,通过百度新闻搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到你网站的新闻,进而为你的网站带来潜在的流量。
《互联网新闻开放协议》该协议主要适用于已经成为百度新闻源的网站;如果你的网站尚未成为百度新闻源,需要先申请收录。
申请成为百度新闻源的网站
如果你的网站符合以下《百度新闻源收录标准》,请你将网站信息发送邮件到 news@baidu.com ,百度将会在7个工作日内对网站进行审核,审核通过后会邮件通知你。
百度新闻源收录标准:
• 百度新闻搜索收录的新闻源网站必须符合及严格遵守国家《互联网新闻信息服务管理规定》,并在新闻发布和转载过程中尊重创作人和源网站的著作权。
• 百度希望新闻源多样化,鼓励原创新闻内容,收录的新闻源网站应正规、合法、有媒体影响力,具有大量有价值的新闻内容,并能及时更新,且网站服务器稳定、高速。
• 百度新闻搜索收录的网站类型包括专业新闻网站和资讯门户、地方信息港、报刊杂志及广播电视媒体、专业及行业网站、政府及组织网站,不适合收录的网站类型包括论坛、博客、公司网站、个人网站等其它非新闻资讯类网站,以及非中文网站。
• 你应对提供的全部内容承担一切法律责任,保证你提供内容的真实性、合法性,并不得侵犯任何第三方的权益。
注意:
1、非新闻资讯类网站提交的信息我们将不予以回复。
2、未通过审核的网站提交的 XML 文件将不予以处理 。
<互联网新闻开放协议>内容
下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。

XML网页示例: XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与你联系。
*<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。
*<item>——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。
*<title>——新闻标题。
*<link>——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个URL,标题相同则属于同一篇新闻,请提供一个URL。
<description>——新闻内容简介。
*<text>——完整的新闻正文(仅包含正文文字,不包含HTML语言等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。
*<image>——新闻正文内相关图片,采用绝对地址。若该篇新闻无相关图片,可以为空;若含有多张图片,请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。
<headlineImg>——为有可能成为头条的新闻制作的头条图,采用绝对地址。
<keywords>——反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不完全依赖于此标签中的内容。
<category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。
<author>——新闻作者,可以为机构或个人 。
<source>——新闻来源,即原创媒体或其它机构 。
*<pubDate>——新闻发布时间,与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟;若你网站的发布时间未记录小时分钟,提供年月日即可。
推荐时间格式:年月日小时分钟秒
如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 |
2005年11月09日10时37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT
<互联网新闻开放协议>使用说明:
1. 为了保证你网站的新闻能够快速、准确地被百度新闻搜索收录,请你严格遵照《新闻开放协议》的各项要求创建XML文件,包括数据格式和数据内容,否则无法成功收录。RSS订阅地址以及其它不符合《新闻开放协议》数据格式要求的XML地址不适合提交。
2. <title>和<text>标签中必须提供完整的相关内容,请不要省略部分内容,也不要增加与该篇新闻不相关的内容。
3. 你可以将网站某一时间段发布的全部新闻放在一个XML文件中,提交一个XML地址;也可以分频道或栏目放在多个XML文件中,提交多个XML地址。但一个XML地址上的新闻只能来源于同一个站点。
4. 测试通过后,XML文件将会被正式收录。这时你可以在百度新闻搜索框内输入“site:网站域名”查看收录的来自你网站的新闻信息。也可以随时使用“查询XML文件状态”功能,查看文件的处理进度和反馈信息。
5. <互联网新闻开放协议>只是对百度spider原有收录方式的一种协助和有益补充,而不是取代。百度spider不保证一定能收录你提交的全部内容。
如何使用百度《互联网新闻开放协议》?>>
百度新闻搜索_互联网新闻开放协议http://news.baidu.com/newsop.html

