第一步:创建XML文件
请你在创建XML文件新闻内容前务必阅读下面百度新闻搜索的收录标准:
1、 百度新闻搜索收录的内容包括:时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等,是由专业人士撰写或编辑的中文信息。
2、 百度新闻搜索收录的内容不包括:个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。
3、百度新闻搜索希望收录高质量的中文新闻,不收录英文等其它非中文新闻。
4、请按照百度公布的《互联网新闻开放协议》 制作XML文件。
• 支持的编码格式有GB2312、GB18030、UTF-8、BIG5,推荐使用GB18030或UTF-8格式。
• 你可以将网站某一时间段发布的全部新闻放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
• 请保持每个XML文件处于按更新周期持续自动更新状态。更新周期可根据你的需要随时进行调整。
• 每个XML文件至多存放最新发布的100条新闻,无需保存之前的新闻。
• 请将发布的新闻按照时间排序,即最新发布的新闻在最上端,否则可能有新闻被遗漏。
• XML标签内容中,除文字文本以外不能包含其它任何代码,下表中的特殊字符必须转换为XML定义的转义字符。否则将发生错误导致搜索引擎不能获取页面上的新闻。
| 字符 | 转义后的字符 | ||
| HTML字符 | 字符编码 | ||
| 和(and) | & | & | & |
| 单引号 | ' | ' | ' |
| 双引号 | " | " | " |
| 大于号 | > | > | > |
| 小于号 | < | < | < |
转义字符中的"&"无需再转。
• 建议你使用CDATA 部件。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束。将包含代码或特殊字符的文本置于CDATA 部件内 ,就无需再对特殊字符进行转义。
第二步:验证XML文件
下面的地址提供了帮助你验证XML文件结构的多种工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使你提供的信息更加标准,确保你发布的新闻信息不被搜索引擎遗漏。
第三步:提交XML网址
提交前请将XML文件上传到你的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
若你提交的XML文件符合百度新闻源收录标准,百度新闻搜索将对你提交的数据进行测试和观察一周。如果XML文件基本按照 《互联网新闻开放协议》的要求制作但存在问题,我们会根据XML页面上提供的邮件地址与你联系。
提交网址:http://news.baidu.com/newsop.html
注意:
1、 对你提交的XML文件进行审核,百度新闻搜索不保证一定能收录你提交的全部内容。
2、 审核通过的XML文件,收录后发现网站发生变化,有不符合百度新闻源收录标准的内容,将停止收录。
3、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。
4、提交地址后请你注意查看弹出窗口中的信息,以确认是否提交成功。
第四步:查询XML文件状态
你可以输入你提交的XML文件地址,查询该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与你提交时的地址完全一致。
查询地址:http://news.baidu.com/newsop.html#ks6
百度新闻搜索_互联网新闻开放协议http://news.baidu.com/newsop.html

搜藏
添加到雅虎收藏