网络协议的重要性与应用:理解进程间通信和网络分层结构(上)
进程间通信有多种方式,包括管道、消息队列、共享内存和信号等。然而,如果不同设备上的进程需要进行通信,就只能通过网络来实现。由于设备的多样性,为了兼容各种设备,就需要一个统一通用的网络协议。
学习网络协议的关键是了解其分层结构。之前在计算机基础专栏已经提到过网络分层的好处。因此,我们将从计算机网络专栏开始,专注讲解网络协议中每一层的作用及其意义。
我们可以将网络理解为寄快递的过程。如果网络没有分层,就像你寄快递没有中间的快递点一样,直接将快递拿到目标客户手中,这样会导致负担过重。因此,快递公司设置了快递站点和中转站,每一层都有自己的责任,例如加快分拣、运输和提高效率等。网络分层也是类似的道理。
现在,让我们开始讲解网络协议吧。
OSI 标准模型
OSI (Open System Interconnect)是一个开放式系统互联模型。虽然实际上互联网使用的模型比标准模型简化了很多,但标准模型就像是法律规定的模型一样。
互联网的通信协议对应了模型中的7个层级中的某一个层级。通过这一点,我们可以了解协议在整个网络模型中的作用。一般来说,各个层级的主要作用如下:
应用层是网络通信中最高层的层级,它负责处理用户的请求和响应。举个例子,当你在浏览器中输入一个网址并按下回车,浏览器就会发送一个HTTP请求到服务器上,请求获取网页的内容。服务器收到请求后会返回一个HTTP响应,其中包含了网页的内容。浏览器接收到响应后,会将网页内容呈现给用户。
表示层是负责数据格式化和编码的层级。在网络通信中,数据需要按照一定的格式进行传输。表示层的任务就是将数据从应用层接收到的格式转换为网络传输所需的格式,或者将接收到的数据转换为应用层可以处理的格式。举个例子,当浏览器发送HTTP请求时,请求中的数据需要进行编码,以确保在网络上能够正确传输(和物理层有区别)。
会话层是建立和管理应用程序之间会话的层级。在网络通信中,应用程序之间需要进行连接和通信。会话层的任务就是确保应用程序之间能够建立稳定的连接,并进行数据的传输和交换。举个例子,当浏览器发送HTTP请求时,会话层负责与服务器建立连接,并管理这个连接的状态,以确保数据的正常传输。
传输层使用TCP协议(传输控制协议)提供可靠的数据传输。当你下载文件时,传输层将文件分割为多个数据包,并确保它们按正确的顺序到达。如果有任何数据包丢失或损坏,传输层将重发丢失的数据包。
网络层负责路由和转发数据包。当你访问一个网站时,网络层将根据目标地址决定数据包的下一跳路由器,并将其转发到正确的目的地。
数据链路层负责将数据包转换为适合在物理媒介上传输的格式。例如,数据链路层将数据包转换为电信号,并使用以太网协议将其发送到局域网上的下一个设备。
物理层负责将数据以电信号的形式在物理媒介上传输。例如,物理层将电信号发送到网线或无线信号发送到无线网络。
TCP/IP 网络模型
TCP/IP网络协议是一种分层结构的协议,通常被划分为五个层级:应用层、传输层、网络层、数据链路层和物理层。这种分层结构的设计是为了实现网络通信的可靠性、灵活性和可扩展性。其实这也是原理上的,是为了好讲解,其实它实际上数据链路层和物理层统一叫网路接口层。是4层结构。
应用层
应用层是TCP/IP网络协议的最上层,也是我们能直接接触到的层级。在应用层,我们使用的电脑或手机应用软件实现了各种功能。当两个不同设备的应用需要通信时,应用层将应用数据传递给下一层,即传输层。
因此,应用层只需要专注于为用户提供应用功能,而不需要关心数据是如何传输的。可以将其类比为我们寄快递时,只需要将包裹交给快递员,由他负责运输快递,而不需要关心快递是如何被运输的。
值得一提的是,应用层工作在操作系统中的用户态,而传输层及以下工作在内核态。这意味着应用层具有更高的灵活性和可定制性,可以根据用户的需求提供各种不同的应用功能。
传输层
传输层(Transport Layer)是为应用层提供网络支持的层级。在传输层,存在两种传输协议,即TCP和UDP。
TCP(Transmission Control Protocol)是传输层控制协议的全称。大多数应用使用的是TCP传输层协议,比如HTTP应用层协议。相比UDP,TCP具有更多的特性,例如流量控制、超时重传和拥塞控制等,这些特性都是为了确保数据包能够可靠地传输给对方。
相对而言,UDP更加简单,它只负责发送数据包,并不保证数据包能够抵达对方。但UDP具有实时性更好和较高的传输效率。当然,UDP也可以实现可靠传输,只需在应用层上实现TCP的特性,但要实现一个商用的可靠UDP传输协议并不是一件简单的事情。
应用层可能需要传输大量的数据,如果直接传输,很难进行控制。因此,当传输层的数据包大小超过TCP的最大报文段长度(MSS),数据包就需要进行分块。这样即使中途有一个分块丢失或损坏,只需要重新传输该分块,而不需要重新发送整个数据包。在TCP协议中,我们将每个分块称为一个TCP段(TCP Segment)。
当设备作为接收方时,传输层需要将数据包传递给相应的应用程序。由于一台设备上可能存在多个应用程序在接收或传输数据,因此需要使用一个编号来区分这些应用程序,这个编号就是端口。例如,80端口通常用于Web服务器,22端口通常用于远程登录服务器。而对于浏览器中的每个标签页,都是一个独立的进程,操作系统会为这些进程分配临时的端口号。
传输层的报文中携带有端口号,因此接收方可以识别出该报文是发送给哪个应用程序的。这样,传输层能够保证将数据准确传递给目标应用程序。
网络层
网络层是TCP/IP网络协议的一个重要层级,其主要任务是实现网络互连,进而实现数据包在各网络之间的传输。
传输层在网络协议中的角色常常被误解,初学者可能会认为传输层是负责将数据从一个设备传输到另一个设备的层级,但事实上传输层并不直接负责实际的数据传输。
在实际的网络环境中,网络结构复杂,存在着各种不同的线路和分叉路口。当一个设备的数据需要传输给另一个设备时,需要在网络的路径和节点中进行选择。然而,传输层的设计理念是简单、高效、专注,它的主要任务是服务好应用层,作为应用间数据传输的媒介。如果传输层还负责处理实际的数据传输功能,就有可能违背了设计原则。
换句话说,我们希望传输层协议不涉足太多的事情,只需要专注于为应用层提供服务。它的作用是帮助实现应用到应用的通信,而实际的数据传输功能则交给下一层,即网络层(Internet Layer)来处理。
在网络层中,最常使用的协议是IP(Internet Protocol)。IP协议将传输层的报文作为数据部分,加上IP包头组装成IP报文。如果IP报文大小超过MTU(在以太网中一般为1500字节),则会进行分片,得到多个IP报文进行发送。
网络层的主要功能是将数据从一个设备传输到另一个设备。由于世界上有如此多的设备,需要有一种方法来区分它们。因此,网络层需要有设备的编号。
我们通常使用IP地址来对设备进行编号。对于IPv4协议,IP地址共有32位,分为四段,每段8位。虽然单独的IP地址可以区分设备,但是在寻址过程中非常麻烦,全球有那么多设备,难道要一个一个匹配吗?这显然不现实。
因此,需要将IP地址分成两个部分:
- 网络号:用于标识该IP地址属于哪个子网。
- 主机号:用于标识同一子网下的不同主机。
如何分割IP地址需要配合子网掩码来计算出IP地址的网络号和主机号。在寻址过程中,先匹配相同的网络号,然后再找对应的主机。举个例子,假设我们有一个IP地址为192.168.1.100,子网掩码为255.255.255.0。首先,我们需要将IP地址和子网掩码转换为二进制形式:
- IP地址:11000000.10101000.00000001.01100100
- 子网掩码:11111111.11111111.11111111.00000000
然后,我们对IP地址和子网掩码进行逻辑与操作,得到:11000000.10101000.00000001.00000000,所以,网络号为192.168.1.0,主机号为0.0.0.100。
除了寻址能力,IP协议还具有另一个重要的功能,即路由。实际场景中,设备之间不是直接通过一条网线连接的,而是通过多个网关、路由器、交换机等网络设备连接起来的。这样就会形成许多网络路径。因此,当数据包到达一个网络节点时,需要通过算法决定下一步应该选择哪条路径。
因此,IP协议的寻址作用是告诉我们去往下一个目的地应该朝哪个方向走,而路由则是根据"下一个目的地"选择路径。寻址更像是导航,而路由更像是操作方向盘。
总结
进程间通信有多种方式,包括管道、消息队列、共享内存和信号等。这些方式都是用于不同进程之间在同一设备上进行通信的。然而,如果不同设备上的进程需要进行通信,就只能通过网络来实现。由于设备的多样性,为了兼容各种设备,就需要一个统一通用的网络协议。
学习网络协议的关键是了解其分层结构。在计算机网络中,我们使用的是OSI标准模型和TCP/IP网络模型。这些模型将网络通信划分为多个层级,每个层级都有不同的功能和作用。
在本章节中,我们主要讲解了TCP/IP网络模型的前三层:应用层、传输层和网络层。应用层提供了各种应用程序之间的通信服务,例如HTTP、FTP和SMTP等。传输层主要负责将数据分割成数据段并进行可靠传输,其中TCP协议提供了可靠的数据传输,而UDP协议则提供了不可靠但效率高的传输方式。网络层则负责将数据包从源主机传输到目标主机,其中IP协议是最常用的网络层协议。后面的数据链路层和物理层将在下一篇文章中进行详细讲解。