五分彩计划领头羊:站多多网络

新闻资讯

五分彩骗局步骤 www.jp5n.cn 力求视觉与交互的完美契合,以规范的流程和专注的态度,为您提供全方位的设计服务

【山东网站制作】网站在优化过程中页面抓取过程简述

来源:武汉网站建设  浏览量:  发布时间:2018-11-08 09:31:20

url,即统一资源定位符,通过对url的分析,我们可以更好地理解页面抓取过程。今天,小小课堂SEO学网带来的是《页面抓取过程简述》。希望本次的SEO技术培训对大家有所帮助。

一、url是什么意思?

URL,英文全称为“uniform resource locator”,中文译为“统一资源定位符”。

网站优化中要求每一个页面有且仅有一个唯一的统一资源定位符(URL),但往往很多网站同一页面对应了很多个URL,如果都被搜索引擎收录且未做URL转向,就会产生权重不集中的情况,通常称为URL不规范。

二、url的组成

统一资源定位符(URL),由三部分组成:协议方案、主机名和资源名。

例如:

https:// www.x**.org /11806

其中https为协议方案,www.***.org 为主机名 ,11806为资源,不过这个资源不太明显,一般资源后缀为.html,当然还可以是.pdf、.php、.word等格式。

三、页面抓取过程简述

无论是我们平时用的互联网浏览器,还是网络爬虫,虽然是两种不同的客户端,但获取页面的方式却是相同的。页面抓取过程如下:

① 连接DNS域名系统服务器

客户端都会先连接到DNS域名服务器上,DNS服务器将主机名( www.***.org )转换为IP地址,并反馈给客户端。

PS:本来我们通过111.152 . 151.45 的地址来访问某网站,为了方便记忆和使用,才利用DNS域名系统转换为了 www.***.org 。这也就是DNS域名系统的作用。

② 连接IP地址服务器

该IP服务器下可能会有很多程序(网站),可以通过端口号来做区分,同时每个程序(网站)都会监听端口是否有新的连接请求,HTTP网站默认为80,HTTPS网站默认为443。

不过通常情况下,端口号80和443是默认不出现的。

举例来讲:

https://www.***.org:443/ = https://www.***.org/

//www.***.org:80/ = //www.***.org/

③ 建立连接并发送页面请求

客户端与服务器建立连接后,会发送页面请求,通常为get,也可以是post。

get 11806 HTTPS/1.0

获取HTTPS协议下的页面11806 返回给客户端。之后如需继续获取更多页面,则发送其他请求,否则将关闭该连接。

PS:通常情况下 ,/seo/11806.html 可能会更清晰。也就是发送 https://www.***.org/ 下的 seo文件夹下的 11806.html 的页面请求。

如未特殊注明,文章均来源于网络! 转载请注明来自://www.jp5n.cn

这篇文章太赞了我也要点赞!

11

郑重声明 Solemn Statement
本文来源://www.jp5n.cn 作者:武汉网站建设@武汉站多多 网络营销策划,本文由武汉站多多版权所有,未经批准转载必究。
站多多客服X
服务热线:

027-87317566
400-8084-027

  • 中共景德镇市委台办开展党风廉政知识测试 2019-03-20
  • 清代的“琉璃厂第一美女”长啥样?真相很惊人 2019-03-19
  • 【思客问答】关于两会,你想问的都在这里! 2019-03-14
  • 法制日报:现金贷变身倒逼监管创新 2019-03-09
  • 我国道路货运行业从业人员超2100万 2019-01-30
  • 开百警讲坛塑智慧警队 2018-12-11
  • 改革开放再出发(在习近平新时代中国特色社会主义思想指引下——新时代新作为新篇章) 2018-12-10
  • 介休交警为企业职工送平安 2018-11-20
  • 第四届中德(欧)中小企业合作交流会举行 2018-09-22
  • 要有传承,但重在创新。这样才不会被历史的进步所淘汰。 2018-09-21
  • 陈扬勇谈“党的领导是中国特色社会主义最本质的特征” 2018-09-13
  • “向党献礼 忠诚保畅” 交警铁骑队正式亮相宜春(多图) 2018-09-05
  • 智能服装让生活更有趣 2018-09-03
  • 吉林省首届艺术节拉开帷幕 2018-09-03
  • 融入长三角一体化新进程 昆山按下快进键 2018-09-01
  • 598| 769| 621| 339| 958| 237| 341| 421| 869| 670|