XML听起来可能有点陌生,但SEOer对网站地图一定不陌生,站长通常会将网站的xml地图提交至各个搜索引擎,以便获得更好地收录效果。 今天,小小课堂SEO自学网带来的是《XML信息检索标准数据格式简介》。希望本次的SEO技术培训对大家有所帮助。 一、什么是信息源? 信息源,是指通过某种物质传出去的信息的发源地。 两点需要注意:一是某种物质传出去,二是信息发源地。 联合国教科文组织1976年出版的《文献术语》一书将信息源定义为: 个人为满足其信息需要而获得信息的来源,称信息源。一切产生、生产、存贮、加工、 传播信息的源泉都可以看作是信息源。 二、XML是什么? XML,英文全称为“eXtensible Markup Language”,中文译为“可扩展标记语言”,是一种简单的数据存储语言。 XML的优势有很多,比如简单易于掌握和使用,专注传输数据,表现行为及其简单,在很多应用程序中都可以使用(不仅仅是网站的xml地图)等。 对于网站优化而言,我们对于XML的认识基本上是停留在XML地图上,制作一个XML地图,然后提交至百度、360、搜狗(部分站点才有)、Google、神马等搜索引擎平台,这样可以让网站被搜索引擎被充分地收录。 既然了解了信息源和XML的基本定义,那么就来聊聊它们之间的关系吧。 三、XML是搜索引擎信息源的标准数据格式 小小课堂SEO自学网简单来介绍两种与网站相关的XML的实际应用。 ① XML网站地图 对于网络爬虫而言,其任务是努力爬行发现更多有价值的内容和发生变化的已收录的页面,然而对于搜索引擎而言会更加期望仅通过监测信息源,就能够发现新的页面,那么这个效果就是XML网站地图。 搜狗搜索引擎对XML网站地图的提交进行了限制,只有符合一定条件(通常是规模和质量)的网站才有资格提交sitemap网站地图(即xml地图),其他搜索引擎都是提倡大家提倡XML网站地图的。 ② RSS阅读器(RSS feed) 对于互联网信息源而言,除了XML网站地图提交给搜索引擎,另外一个通用标准格式即为RSS。人们可以使用RSS阅读器订阅网站的RSS信息源,就可以直接获取RSS信息源网站的最新文章了。 其实RSS就是采用了XML数据格式来传递数据的,网站只要有RSS接口(feed),就可以成为一个RSS的信息源。 就拿WordPress而言,其RSS接口一般为网站的feed栏目,所以这个RSS接口又称为feed。 以小小课堂SEO自学网为例,其feed地址为:https://www.***.org/ feed/ PS:更优秀一些的网站可能会去申请搜索引擎新闻源站点,也都是信息源的实际应用。