计算机网络基本原理,电脑网络知识:三分钟了解计算机网络通信原理,成为黑客的必须课
一、计算机网络的4大发展阶段
1.面向终端的计算机网络
以单个计算机为中心的远程联机系统,构成面向终端的计算机网络。这种系统用一台中央主机连接大量的地理上处于分散位置的终端,其中终端都不具备自主处理的能力。例如,20世纪50年代初美国的半自动地面防空SAGE系统,该系统将远距离的雷达和其他设备的信息,通过通信线路汇集到一台旋风计算机,第一次实现了利用计算机远距离的集中控制和人—机对话。SAGE系统的诞生被誉为计算机通信发展史上的里程碑。从此,计算机网络开始逐步形成和发展。
综合化是指采用交换的数据传送方式将多种业务综合到一个网络中完成,例如,它不但可以传输数据,还可以传输图像、声音、影像等多媒体信息,三网(电话网、有线电视网和数据网)融合甚至多网融合已成为一个重要的发展方向。
高速化是指传输数据的速率得到极大提高,早期的以太网其数据速率只有10Mbps。而目前,速度达100Mbps的以太网已相当普及,速度再提高十倍、达Gbps的产品也已面世。
二、计算机网络基础知识
“黑客”的目的是寻找目标漏洞,然后去发起攻击或者提出解决方案修补漏洞,而寻找漏洞的过程,你就需要掌握很多知识,例如计算机原理、计算机网络、操作系统、计算机软件、编程语言、数据结构、数据库技术、前沿技术等等,在这么多要学习的内容里,首先需要先学习”网络通信原理”,为什么?因为网络通信原理十分重要,根据他的原理可以判断出许多貌似正确的理论其实是有很多漏洞的通信过程,而很多黑客攻击就是利用了这些漏洞,很多网络安全解决方案也是用来解决这些漏洞问题的。
(一)、网络的由来?
互联网的本质就是一系列的网络协议。
一台硬设有了操作系统,然后装上软件你就可以正常使用了,每个人都拥有一台自己的机器,然而彼此孤立。
如何能让大家一起玩耍,就有了初步的网络,其实两台计算机之间通信与两个人打电话之间通信的原理是一样的,普通话属于中国国内人与人之间通信的标准,那如果是两个国家的人交流呢?问题是,你不可能要求一个人/计算机掌握全世界的语言/标准,于是有了世界统一的通信标准:英语
结论:英语成为世界上所有人通信的统一标准,如果把计算机看成分布于世界各地的人,那么连接两台计算机之间的internet实际上就是一系列统一的标准,这些标准称之为互联网协议,互联网的本质就是一系列的协议,总称为’互联网协议’(Internet Protocol Suite).
互联网协议的功能:定义计算机如何接入internet,以及接入internet的计算机通信的标准。
(二)、网络协议介绍
为了使不同计算机厂家生产的计算机能够相互通信,以便在更大的范围内建立计算机网络,国际标准化组织(ISO)在1978年提出了”开放系统互联参考模型”,即著名的OSI/RM模型(Open System Interconnection/Reference Model)。它将计算机网络体系结构的通信协议划分为七层,自下而上依次为:物理层(Physics Layer)、数据链路层(Data Link Layer)、网络层(Network Layer)、传输层(Transport Layer)、会话层(Session Layer)、表示层(Presentation Layer)、应用层(Application Layer)。其中第四层完成数据传送服务,上面三层面向用户。
互联网协议按照功能不同分为osi七层或TCP/ip五层
tcp三次握手和四次挥手
6、Socket:我们知道两个进程如果需要进行通讯最基本的一个前提能能够唯一的标示一个进程,在本地进程通讯中我们可以使用PID来唯一标示一个进程,但PID只在本地唯一,网络中的两个进程PID冲突几率很大,这时候我们需要另辟它径了,我们知道IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。
能够唯一标示网络中的进程后,它们就可以利用socket进行通信了,什么是socket呢?我们经常把socket翻译为套接字,socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。
socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种”打开—读/写—关闭”模式的实现,服务器和客户端各自维护一个”文件”,在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。
(三)、网络通信实现
每台主机实现网络通信的基本四要素:
本机的IP地址
子网掩码
网关的IP地址
DNS的IP地址
获取这四要素分两种方式:
1.静态获取
即手动配置
2.动态获取
通过dhcp获取
(1)最前面的”以太网标头”,设置发出方(本机)的MAC地址和接收方(DHCP服务器)的MAC地址。前者就是本机网卡的MAC地址,后者这时不知道,就填入一个广播地址:FF-FF-FF-FF-FF-FF。
(2)后面的”IP标头”,设置发出方的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址设为255.255.255.255。
(3)最后的”UDP标头”,设置发出方的端口和接收方的端口。这一部分是DHCP协议规定好的,发出方是68端口,接收方是67端口。
这个数据包构造完成后,就可以发出了。以太网是广播发送,同一个子网络的每台计算机都收到了这个包。因为接收方的MAC地址是FF-FF-FF-FF-FF-FF,看不出是发给谁的,所以每台收到这个包的计算机,还必须分析这个包的IP地址,才能确定是不是发给自己的。当看到发出方IP地址是0.0.0.0,接收方是255.255.255.255,于是DHCP服务器知道”这个包是发给我的”,而其他计算机就可以丢弃这个包。
接下来,DHCP服务器读出这个包的数据内容,分配好IP地址,发送回去一个”DHCP响应”数据包。这个响应包的结构也是类似的,以太网标头的MAC地址是双方的网卡地址,IP标头的IP地址是DHCP服务器的IP地址(发出方)和255.255.255.255(接收方),UDP标头的端口是67(发出方)和68(接收方),分配给请求端的IP地址和本网络的具体参数则包含在Data部分。
新加入的计算机收到这个响应包,于是就知道了自己的IP地址、子网掩码、网关地址、DNS服务器等等参数。
(四)、例举主机访问网站的网络通信过程
首先打开浏览器,在地址栏输入URL,回车,出现网站内容。这是我们几乎每天都在做的事,那这个过程中到底是什么原理呢?HTTP、TCP、DNS、IP这些耳熟能详的名词都在什么时候起着什么作用呢?在这里整体梳理一遍。
4.1整个过程基本分做下面几个部分:
1、域名解析成IP地址;
2、与目的主机进行TCP连接(三次握手);
3、发送与收取数据;
4、与目的主机断开TCP连接(四次挥手);
4.2下面分别进行详细说明。
4.2.1域名解析成IP地址
首先说什么是域名解析?
我们在浏览器地址栏中输入的都是类似”www.baidu.com”、”www.qq.com”等等容易记忆的英文域名,但这些字母你直接交给整个网络线路去寻找目的主机找得到吗?找不到,因为每个主机在网络中的位置都是以IP标识的,IP才是主机在网络中的位置,域名只是为了方便用户记忆而已,这就要求浏览器能够识别域名并且将其转化为对应的IP地址。
所以浏览器会有一个DNS缓存,其中记录了一些域名与IP的对应关系,供浏览器快速查找需要的IP。但是这个DNS缓存不可能存下所有的域名-IP地址,何况IP地址有时候还会变化,因此当在DNS缓存中没有找到的时候,就要先向DNS服务器请求域名解析,我们常听到的DNS服务器很大的作用就是进行域名解析。
值得一提的是,DNS域名解析时用的是UDP协议。
整个域名解析的过程如下:
1、浏览器向本机DNS模块发出DNS请求,DNS模块生成相关的DNS报文;
2、DNS模块将生成的DNS报文传递给传输层的UDP协议单元;
3、UDP协议单元将该数据封装成UDP数据报,传递给网络层的IP协议单元;
4、IP协议单元将该数据封装成IP数据包,其目的IP地址为DNS服务器的IP地址;
5、封装好的IP数据包将传递给数据链路层的协议单元进行发送;
6、发送时在ARP缓存中查询相关数据,如果没有,就发送ARP广播(包含待查询的IP地址,收到广播的主机检查自己的IP,符合条件的主机将含有自己MAC地址的ARP包发送给ARP广播的主机)请求,等待ARP回应;
7、得到ARP回应后,将IP地址与路由的下一跳MAC地址对应的信息写入ARP缓存表;
8、写入缓存后,以路由下一跳的地址填充目的MAC地址,以数据帧形式转发;
9、转发可能进行多次;
10、DNS请求到达DNS服务器的数据链路层协议单元;
11、DNS服务器的数据链路层协议单元解析数据帧,将内部的IP数据包传递给网络层IP协议单元;
12、DNS服务器的IP协议单元解析IP数据包,将内部的UDP数据报传递给传输层UDP协议单元;
13、DNS服务器的UDP协议单元解析收到的UDP数据报,将内部的DNS报文传递给DNS服务单元;
14、DNS服务单元将域名解析成对应IP地址,产生DNS回应报文;
15、DNS回应报文->UDP->IP->MAC->我的主机;
16、我的主机收到数据帧,将数据帧->IP->UDP->浏览器;
17、将域名解析结果以域名和IP地址对应的形式写入DNS缓存表。
其中提到了一个ARP的概念,类似于DNS将域名翻译成IP,ARP则是将IP翻译成MAC地址,我们知道了IP后,需要通过主机的MAC地址来更具体的找到主机。同样的也有一个ARP缓存,其中存储了一些IP与MAC地址的对应关系,如果缓存中找不到,就会进行广播来查找MAC地址,收到广播的主机会检查自己的IP是否是待查找的IP,是的话就返回自己的MAC地址。
如果做开发,往往还会接触到端口这个概念,那端口是什么呢?这里是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等,都有一些固定的端口号,被占用后就不能被别的服务拿来传输数据了。
4.2.2与目的主机进行TCP连接(三次握手)
得到域名对应的IP地址后,也就表示可以将数据送达目的主机了,这时候才开始我们常说的三次握手建立连接。
HTTP的请求时使用TCP进行传输的,可以保证可靠传输,并且有序,而TCP是有连接的传输,也就是在传输数据之前,会建立我的主机与目的主机之间的连接,然后才能传输数据,传输完成后,还有断开连接。这也就是TCP的三次握手和四次挥手,大致过程如下图所示:
具体的三次握手建立连接的过程如下表述,其中数据包的传输过程类似上文请求DNS服务器时的过程,就简单的表示一下:
1、向目的主机发送TCP连接请求报文;
2、该TCP报文中SYN标志位设为1,表示连接请求;
3、该TCP报文通过IP(DNS)->MAC(ARP)->网关->目的主机;
4、目的主机收到数据帧,通过IP->TCP,TCP协议单元回应请求应答报文;
5、该报文中SYN和ACK标志设为1,表示连接请求应答;
6、该TCP报文通过IP(DNS)->MAC(ARP)->网关->我的主机;
7、我的主机收到数据帧,通过IP->TCP,TCP协议单元回应请求确认报文;
8、该TCP报文通过IP(DNS)->MAC(ARP)->网关->目的主机;
9、目的主机收到数据帧,通过IP->TCP,连接建立完成。
三次握手的过程就是一去一回一去,互相确认一下,就建立连接啦。这个过程中任何一个报文出错或者超时,都要进行重传。
4.2.3发送与收取数据
如上所说,只有建立连接后才能开始传输数据,数据其实有多种传输方式,比如分段啊分组啊分时啊等等。而一个数据包的传输过程如下所示,以HTTP的GET方法请求为例:
1、浏览器向域名发出GET方法报文;
2、该GET方法报文通过TCP->IP(DNS)->MAC(ARP)->网关->目的主机;
3、目的主机收到数据帧,通过IP->TCP->HTTP,HTTP协议单元会回应HTTP协议格式封装好的HTML形式数据;
4、该HTML数据通过TCP->IP(DNS)->MAC(ARP)->网关->我的主机;
5、我的主机收到数据帧,通过IP->TCP->HTTP->浏览器,浏览器以网页形式显示HTML内容。
其他的HTTP方法在传输数据时方法都类似,只是所携带的内容不同。
4.2.4与目的主机断开TCP连接(四次挥手)
数据传输完成后需要断开连接,与建立时不同,断开连接需要多一次,有四次挥手,至于为什么,看完过程我们再讲。
看图理解过程:
过程如下:
1、浏览器向目的主机发出TCP连接结束请求报文,此时进入FIN WAIT状态;
2、该报文FIN标志位设为1,表示结束请求;
3、TCP结束请求报文通过IP(DNS)->MAC(ARP)->网关->目的主机;
4、目的主机收到数据帧,通过IP->TCP,TCP协议单元回应结束应答报文;
5、当前只是进行回应,因为目的主机可能还有数据要传,并不急着断开连接;
6、该报文中ACK标志位设为1,表示收到结束请求;
7、目的数据发送完所有数据后,向我的主机发出TCP连接结束请求报文;
8、该报文FIN标志位设为1,表示结束请求;
9、TCP结束请求报文通过IP(DNS)->MAC(ARP)->网关->我的主机;
10、我的主机收到数据帧,通过IP->TCP,TCP协议单元回应结束应答报文,此时进入TIME WAIT状态,因为不相信网络是可靠的,如果目的主机没收到还可以重发;
11、该报文中的FIN标志位均设为1,表示结束应答;
12、该TCP回应报文通过IP(DNS)->MAC(ARP)->网关->目的主机;
13、目的主机关闭连接;
14、TIME WAIT等待结束后,没有收到回复,说明目的正常关闭了,我的主机也关闭连接。
这里的过程是以我的主机主动发起结束请求开始的,实际上也可以由目的主机主动发起,那么过程就会跟上面相反,但细节差不多。
FIN_WAIT状态是主动发起请求时等待确认信息,而TIME_WAIT状态是收到结束请求后发送确认信息后等待看是否需要重发。
现在来说说为什么断开连接时需要四次挥手呢?因为建立连接时目的主机可以直接发送SYN(同步) ACK(应答)报文。而当断开时,目的主机收到FIN后可能还有数据要发,并不一定直接断开,所以先发送一次应答,告知我的主机收到了请求,等确认所有数据都发完了,再发送FIN,同时等待我的主机应答,这里的FIN和ACK就不能一起发送,所以需要四次。
4.2.5总结一下:
以上就是主机访问网站时的网络通信全过程,归纳起来就是:
首先要通过域名找到IP,如果缓存里没有就要请求DNS服务器;得到IP后开始于目的主机进行三次握手来建立TCP连接;连接建立后进行HTTP访问,传输并获取网页内容;传输完后与目的主机四次挥手来断开TCP连接。
如发现本站有涉嫌抄袭侵权/违法违规等内容,请<举报!一经查实,本站将立刻删除。