网络编程 socket详解 TCP socket和UDP socket-程序员宅基地

技术标签: 网络  服务器  socket  网络协议  tcp/ip  

概述

        我们在网络编程时,通常是让我们本地的应用程序和远程的应用程序进行通信,也就是分布式的进程之间的通信,比如我写的程序A和小明的程序B进行通信,我的程序运行时在本机就是一个进程,是有pid号的,小明的也是。那这两个程序是怎么通信的呢?

        这就要理解网络分层的概念了,网络层实现的是主机到主机之间的通信,网络层的实现是ip协议,通过各自的ip地址就能实现远程数据传输,而网络层只是保证了主机A的数据能够到达主机B,并不能够识别和发送到对应的进程,而传输层实现的是进程到进程的通信,对网络层的功能进行了加强,能够把数据交付给对应的进程。

        有了传输层的功能,我们用户才能进一步的去实现自己的应用层协议,实现应用。当我们需要远程通信时只需要通过下层的传输层传输数据即可

        但是想象一下,每次我在应用层发送数据时至少都是需要把 要发送的信息、本机ip、本地端口、目的ip和目的端口这五个数据通过层间接口交给传输层(对于TCP协议来说的,UDP无连接不需要应答所以不需要本机ip和端口),如下图

         但是每一次应用层向传输层发送数据时都需要发送这些数据是不是很多余?TCP一旦双方建立起连接了,那么除了数据部分,其他的都是相同的,没有必要每次发送数据都发送一遍,为了减少层间接口的传输量,就出现了socket,操作系统底层维护一个列表,用于存放多个socket,即多个会话关系。

        socket套接字是传输层提供给应用层的一个API,底层实现就是一个整数,是传输层和应用层的一个约定,该整数就像是打开一个文件并得到文件句柄一样,对这个句柄进行的操作就是对该文件进行操作,方便管理。

有了socket之后应用层数据的传输就变为了这样

传输层概述

        先来说说网络层的ip,ip协议在网络上发送数据包是不可靠的,有可能造成丢失,乱序等问题,如发送数据包到对应的路由器,路由器有接收缓冲区,如果发现同一时刻来的数据包太多了,缓冲区放不下,它是可以把装不下的数据包扔掉的。这就是不可靠的传输。

传输层提供了TCP和UDP两种服务:

  • TCP:对ip协议进行了增强,通过一些方式来达到可靠的数据传输
  • UDP:不可靠的数据传输,它只对ip增加了进程到进程之间的通信,其他的就没了,原原本本

TCP套接字编程

        TCP socket反应的是应用进程A和应用进程B会话关系的一个代表,A对对应的socket发送数据,就是A对B发送数据;A对对应的socket接收数据就是对B接收数据。

大致过程

1.服务器进程必须运行,创建一个欢迎socket,该socket和本地的端口进行捆绑,在欢迎socket上阻塞式的等待接收客户端的连接

2.客户端创建本地的套接字,隐式捆绑到本地的端口,再指定服务器的ip和端口进行连接。

3.服务器接受来自用户端的请求 ,解除阻塞式等待,返回一个 新的socket(与欢迎socket不 一样),与客户端通信

4.连接API调用有效时,客户端与服务器建立了TCP连接,即可以通信了

代码如下:

@Test
public void server() throws IOException {
    //1.建立欢迎socket,绑定一个监听的端口号
    ServerSocket welcomeSocket = new ServerSocket(8080);
    //2.阻塞的等待客户端的连接请求,连接请求到来时创建一个新的socket,与客户端绑定
    Socket socket = welcomeSocket.accept();
    //6.从该socket接收数据
    InputStream is = socket.getInputStream();
    int len = 0;
    while ((len = is.read()) != -1) {
        System.out.print((char) len);
    }
    socket.close();
}

@Test
public void client() throws IOException {
    //3.建立一个客户端这边的socket
    Socket socket = new Socket();
    //4.阻塞的请求连接到指定ip和端口号的服务器进程
    socket.connect(new InetSocketAddress("localhost", 8080));
    //5.发送数据到该socket
    OutputStream os = socket.getOutputStream();
    byte[] bytes = new byte[1024];
    os.write("hello".getBytes());
    socket.shutdownOutput();
}

详细过程

首先来看java中socket的结构体(类),其他语言都大同小异。

public abstract class SocketImpl implements SocketOptions {    
    /**
     * The IP address of the remote end of this socket.远程主机的ip地址
     */
    protected InetAddress address;
    /**
     * The port number on the remote host to which this socket is connected.远程主机的端口
     */
    protected int port;
    /**
     * The local port number to which this socket is connected.本地端口
     */
    protected int localport;
    /**
     *实际还有一个本机的ip地址,被省略掉了
     */
}

InetAddress类就不介绍了,里面就是封装了ip地址等信息。

ServerSocket和Socket类是一个东西,只时名字不同而已。具体可以看源码。

可以得出来socket其实大致就是这么一个6元组(这里省略了socket的状态),当我们应用进程创建socket时,操作系统给该socket一个唯一的整数标识,且肯定是要保存是哪个进程创建的socket,所以pid也应该对应起来,方便日后能给找到对应的进程。

 我们举例如下图的一个通信过程来具体的说明socket的通信过程:

1.首先服务器进程先建立一个欢迎socket,用于监听连接请求,并且绑定端口号为8080,阻塞监听客户端的连接请求,如下图

 2.这时候客户端也新建一个socket(该socket以后会当做和服务器的通信socket),这个socket不用像服务器那样绑定一个固定的端口号用于监听,但是操作系统会给该socket绑定一个随机的端口,这里假设是4567。如下图,此时客户端的1号socket还是一个无效的状态,因为还没有连接

3.客户端用刚刚建立的socket和远程服务器进行连接connect,指明服务器的地址和对应的端口号,此时socket的状态也就补齐了,随后客户端进入阻塞模式进行TCP的三次握手,请求和服务器建立连接

 4.服务器和客户端TCP连接建立好后,解除阻塞,并且返回一个新的socket(因为不能占用welcome socket),新的socket就是服务器和客户端的一个连接状态,该socket变为一个有效状态,此时服务器继续进入阻塞状态等待此socket的数据。

5. 连接建立好后,客户端也解除阻塞,它的socket1也变为有效状态。然后客户端把需要发送的数据和对应的socket1(输出流里面封装了socket)交给下层传输层,此时的传输层得到了它相应的信息,根据socket就可以从表中查到需要发送的目的ip和端口,继续交给下层直到发送到服务器。

6.服务器的tcp层收到数据包后,查看源ip、目的ip、源端口、目的端口,一一对照自己的socket表,发现2号socket真好对应,且得知2号socket是pid为100的应用进程,所以tcp把数据发送给该进程,服务器的java进程解除阻塞,read客户端发送来的数据。

7.最后如果服务器和客户端某一方没有数据发了,不想建立连接了,就调用close方法,进行TCP的四次挥手,解除连接,使两边对应的socket都变得无效。

UDP套接字编程

        UDP是没有建立连接这一过程的,也不需要维持会话关系,每个报文都是独立传输的。因此UDP只能使用一个整数来标志当前应用进程,不能够固定住对方的ip和端口号,因为UDP通信前不建立连接,可能现在发的这个ip和端口是一台主机,而下次用同样的ip和端口发的就是另一台主机了。所以每次发送的时候都需要指定发送的目的ip和端口。

UDP的socket大致如下

 java中UDPsocket结构如下

public abstract class DatagramSocketImpl implements SocketOptions {

    /**
     * The local port number.
     */
    protected int localPort;
    /**
     * 省略本机ip
     */
}

UDP简单套接字编程如下:

@Test
public void server() throws IOException {
    //1.创建udp socket,并绑定到本机ip和8080端口号
    DatagramSocket socket = new DatagramSocket(8080);
    byte[] buff = new byte[100];
    //存放数据包的容器
    DatagramPacket packet = new DatagramPacket(buff, 0, buff.length);
    //接收数据包
    socket.receive(packet);
    System.out.println(new String(packet.getData(), 0, packet.getLength()));
    socket.close();
}

@Test
public void client() throws IOException {
    DatagramSocket socket = new DatagramSocket();
    byte[] data = "hello".getBytes();
    //指明发送端的ip和端口和数据部分
    DatagramPacket packet = new DatagramPacket(data, data.length, InetAddress.getByName("127.1.1.1"), 8080);
    //使用该socket发送数据包
    socket.send(packet);
}

详细步骤如下:

1.服务器创建一个udp的socket,绑定端口8080用于监听数据包,通过调用receive方法阻塞的监听。

  2.客户端创建一个自己的socket,该socket的端口假设操作系统分配的是4567

 3.客户端发送数据包、目标ip和目标端口给下层的传输层,传输层就能够得到源ip、源端口、目的ip和目的端口,然后一步一步的打包交给下层,发送到服务器主机,服务器主机通过数据包的目的ip和目的端口,对比发现socket对应,然后把数据发送给对应的pid号为100的应用进程。

4.服务器解除阻塞,收取数据。

5.最后关闭连接,删除对应的socket

注意的是UDP是没有welcome socket的

补充

再补充一个小知识点,那就是端口号和进程的联系

进程pid是否可供计算机之间使用呢?

        应用层代表的就是我们的应用进程,既然进程代表着应用层,那为什么进程pid不能作为应用层的标识来进行计算机之间传输呢?而是使用额外的端口号呢?

(1)首先: 单个计算机中的进程使用pid来标志的,但是在互联网环境下使用的计算机操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符,为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须使用统一的方法对TCP/IP体系的进程进行标识;

(2)其次:一个机器上运行的进程不能成为互联网上通信的最后终点,因为进程的创建和撤销都是动态的,通信的一方几乎无法识别对方机器的进程是哪一个;

例如:要和互联网上某个邮件服务器联系,几乎无法得知其服务器邮件进程的进程标识符,因为进程标识符是随机分配的;所以,我们并不一定要知道这个服务器服务是由目的主机那个进程实现的;

所以,不能使用进程标识符来做计算机之间的进程通信标识;

如何使用端口号进行通信?
   
    两个计算机中进程要互相通信,除了必须指定对方的IP地址,还需要知道对方的端口号;

例如:我们寄信的过程说明,当我们要给某人写信时,除了通讯地址还要有收件人的名字,这里的通讯地址就是IP地址,但是收件人的名字却不是进程标识符,因为有可能这个人用的是法文、德文、英文名字,快递员无法识别,因此采用 “菜鸟驿站" 的模式,为每个地址配备多个快递箱(端口号),快递员只是将包裹放置具体的快递箱(端口号),收件人通过监听某个快递箱是否有快递(TCP或者UDP),来进行数据接收,最终拿到需要的包裹(数据);

端口号如何分配?

        (1)服务器使用的端口号:

        一类为熟知端口号或系统端口号(0~1023),将一些重要的应用程序进行登记,所以将一些端口号固定的分配给它们,以便于让所以的用户的了解,与之建立联系; 

        另一类为登记端口号(1024~49151),为那些不知名的应用程序使用;

        (2)客户机使用的端口号:

        也称为短暂端口号,由于这类端口仅仅在客户进程进行时才动态选择,留给客户进程短暂使用,当通信结束后,刚才使用过的客户端口号不复存在,可以继续供其他客户进程使用;
 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45902285/article/details/122814167

智能推荐

Android开发之input子系统二之创建自己的input_android 系统添加自定义input事件-程序员宅基地

文章浏览阅读1.1k次。参考:http://blog.csdn.net/myarrow/article/details/12105973一、概略根据章节一的内容我们大致了解了android系统的input子系统的一些信息,但是有时候系统自动提供的input事件却并不能满足我们的实际需求,android系统针对这个也为我们提供了uinput。二、APIuinput_user_dev 基于Android..._android 系统添加自定义input事件

基于双V7的高性能6U VPX载板-程序员宅基地

文章浏览阅读68次。其中XC7VX690T-2FFG1761扇出2个FMC接口 ,通过每个FMC接口可向外部提供82对高速差分线(含2对差分时钟线)、 10组共20对超高速DP 差分对及2对超高速差分时钟线。其中XC7VX690T-2FFG1761搭配2组共10片(每组其中1片作为ECC校验)16bit 4Gb的DDR3-1866SD RAM, XC7VX690T-2FFG1927搭配5片(其中1片作为ECC校验)相同规格的DDR3SDRAM和1片36Mb的QDRII SRAM。—支持—个M.2 SATA接口;

Docker安装DockerUI可视化管理_dockerui安装-程序员宅基地

文章浏览阅读1.3k次。文章目录一、查找要安装的镜像版本二、安装命令详解二、Docker安装案例1、安装MySQL2、安装Redis3、安装JDK4、安装RabbitMQ一、查找要安装的镜像版本docker search $NAME其他用到的命令,参考《Docker的常用命令大全》。二、安装命令详解docker run -d -p 6379:6379 -v /data/redis:/var/redis --name redis redisdocker run:启动containerredis:要启动的image_dockerui安装

mysql有关运维的面试题_分享12道mysql 运维dba经典面试题,听说能答对一半月薪10k+...-程序员宅基地

文章浏览阅读839次。概述想知道mysql dba运维面试时都会被问到哪些问题吗?特整理出20个运维经典面试题供大家参考学习,据说知道一半答案的人,月薪能过万~1、MySQL的复制原理以及流程基本原理流程,3个线程以及之间的关联;(1)主:binlog线程——记录下所有改变了数据库数据的语句,放进master上的binlog中;(2)从:io线程——在使用start slave 之后,负责从master上拉取 binl..._dba运维面试题

包装类详解、Integer和Character类的常用方法。-程序员宅基地

文章浏览阅读250次,点赞3次,收藏7次。八种基本数据类型对应的引用类型--包装类前两种包装类Boolean和Character比较特殊,他们是Object的子类后六种包装类都是Number的子类在我理解看来,Number和Character,Boolean属于同一级,他们都会Object的zilei,而Byte,Long,Integer,Float,Double,Short又是Number的子类。这就是包装类的继承关系。

Java框架总结-程序员宅基地

文章浏览阅读6.3w次,点赞178次,收藏1k次。本系列用来记录常用java框架的基本概念、区别及联系,也记录了在使用过程中,遇到的一些问题的解决方法,方便自己查看,也方便大家查阅。欲速则不达,欲达则欲速!一、SSH1、基本概念SSH框架是JAVA EE中三种框架所集成,分别是Struts,Spring,Hibernate框架所组成,是当前比较流行的java web开源框架。集成SSH框架的系统从职责上分为(Struts2--..._java框架

随便推点

CTFHUB-web-SQL注入_ctfhub sql注入-1-程序员宅基地

文章浏览阅读683次。CTFHUB SQL_ctfhub sql注入-1

Web端和App端测试的区别_app端和web端测试区别-程序员宅基地

文章浏览阅读1.6w次,点赞22次,收藏334次。Web端和App端测试的区别Web项目是B/S架构,基于浏览器的。App项目是C/S架构,必须要有客户端,用户需要安装客户端。对于更新版本,Web项目只需要更新服务端,客户端就会同步更新,而App项目需要客户端和服务端都同时更新。Web端和App端测试的区别包括以下:①从测试流程上看,基本没有区别。都是需要经历测试计划方案、用例设计、用例执行、缺陷管理、测试报告编写等相关活动。②从测试类型上,基本相似。都需要功能测试、性能测试、安全性测试、GUI测试等。web测试是基于浏览器的,所以不用考虑安装_app端和web端测试区别

python循环嵌套的内循环控制变量与外循环变量可以同名,python 实现循环定义、赋值多个变量的操作...-程序员宅基地

文章浏览阅读1.6k次。exec函数,可以循环定义、赋值多个变量exec ("temp%s=1"%1)这段代码的意思是,让exec执行temp1=1。字符串里面的%s由‘1'代替了。我们在外面再套一个循环就可以实现对多个变量的定义了。for i in range(10):exec ("temp%s=1"%i)在这里,通过一个循环来生成10个变量,i的变化从0到9。用变量i替代%s,所以在每次循环里面,分别给temp0、t..._如何在嵌套循环中使用多个循环变量?

在vue项目中使用pdf.js渲染base64编码的pdf进行预览_vue引用pdf.js 解析base64加密流文件-程序员宅基地

文章浏览阅读1.8k次。有个要在前端页面预览 pdf 的需求,于是参考了几篇网上的文章完成了需求。1.使用PDF.js实现前端和手机端网页预览PDF文件(可定制,支持本地文件、Base64编码和远程URL跨域方式)2.PDF.js直读Base64编码(间接解决跨域问题)3.vue项目中pdf预览插件---vue-pdf 使用..._vue引用pdf.js 解析base64加密流文件

JS基础&实战--day08-程序员宅基地

文章浏览阅读65次。DOM事件文档的加载DOM查询DOM查询的其他的方法DOM增删改使用DOM操作CSS读取元素的样式其他样式操作的属性DOM<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <title></title> </head> <body> <button id="btn">我是一个按钮</button> <.

元组和列表使用错误,学python3时遇到的的一些小错误_python3输入列表和元组都报错-程序员宅基地

文章浏览阅读983次。代码bicycles = {'zhang', 'shou', 'long'}print(bicycles[0].title())报错Traceback (most recent call last): File "D:/python编程/run.py", line 2, in <module> print(bicycles[0].title())TypeErr..._python3输入列表和元组都报错