python进行二进制数据处理的方法

2023-12-19 19:07 由嗨学编程发表于 #后端开发

方法一：

使用struct模块，特点轻量化，简单易用。缺点就是可读性不是太好，使用小数据临时使用一下，对于大量的数据解析，写起来比较繁琐，显得有点力不从心。

import struct

data = b'\x92\xaa\xbb\xcc\x11\x22\x33\x44'
a,b,c,d,e = struct.unpack(">BBBBI", data)
print("a=0x%x b=0x%x c=0x%x d=0x%x e=0x%x"%(a,b,c,d,e))
packData = struct.pack(">BBBBI", a, b, c, d, e)
print("packData: %s"%packData)

上面的程序会按照给定的格式一次解析数据，得到的输出结果如下：

注：建议采用python3运行，python2不区分bytes和string类型，通过struct.pack()得到的结果为字符串类型，会打印出乱码。

a=0x92 b=0xaa c=0xbb d=0xcc e=0x11223344
packData: b'\x92\xaa\xbb\xcc\x11"3D'

可以看出，能够正确的解析和组装出需要的的数据。

struct常用函数原型如下：

struct的方法	说明
pack(fmt, v1, v2…)	按照fmt指定的格式化要求，格式化v1,v2等后续参数，返回bytes类型
unpack(fmt, BytesData)	按照fmt指定的格式要求，解析出bytesData里面的数据内容，返回的是数据元组
pack_from(fmt, BytesData, offset)	按照fmt指定的格式要求，解析后面的内容，从offset处开始解析，返回的是数据元组

这个里面的fmt表示格式化字符串，由两个部分组成，第一部分为指定大小端格式，第二部分是依次解析的格式。

大小端格式字符	说明	.
`>`	大端模式	和阅读顺序一致，高字节在前（内存地址小），低字节在后（地址大）。
`<`	小端模式	和大端相反，高字节在后（内存地址大），低字节在前面（地址小）。
`@或者=`	主机默认字节序	和主机系统强相关，X86/X64默认为小段模式。其中@还会强制4字节对齐。

解析格式如下：

格式字符	ctypes类型	字节数
c	c_char	1
b	c_byte	1
B	c_ubyte	1
h	c_short	2
H	c_ushort	2
i	c_int	4
I	c_uint	4
q	c_longlong	8
Q	c_ulonglong	8
f	c_float	4
d	c_double	8
p	c_char_p	4（64位系统为8）
P	c_void_p	4（64位系统为8）
x	c_ubyte（占位padding字节）	1

方法二：

使用ctypes模块高效的解析组装二进制数据，这种方法和C比较类似，也更为强大。

import ctypes

class TestBig_Struct(ctypes.BigEndianStructure):
    _fields_=[
        ('b1', ctypes.c_ubyte,1),
        ('b2', ctypes.c_ubyte,1),
        ('b3', ctypes.c_ubyte,1),
        ('b4', ctypes.c_ubyte,1),
        ('lev',ctypes.c_ubyte,4),
        ('BB', ctypes.c_ubyte),
        ('BC', ctypes.c_ubyte),
        ('BD', ctypes.c_ubyte),
        ('SS', ctypes.c_ushort),
    ]
    

class Test_Struct(ctypes.Structure):
    _fields_=[
        ('b1', ctypes.c_ubyte, 1),
        ('b2', ctypes.c_ubyte, 1),
        ('b3', ctypes.c_ubyte, 1),
        ('b4', ctypes.c_ubyte, 1),
        ('lev',ctypes.c_ubyte, 4),
        ('BB', ctypes.c_ubyte),
        ('BC', ctypes.c_ubyte),
        ('BD', ctypes.c_ubyte),
        ('SS', ctypes.c_ushort),
    ]
#学习中遇到问题没人解答？小编创建了一个Python学习交流群：711312441
if __name__ == '__main__':
    test = Test_Struct();
    test.b1 = 1;
    test.b2 = 0;
    test.b3 = 0;
    test.b4 = 1;
    test.lev = 2;
    test.BB = 0xAA;
    test.BC = 0xBB;
    test.BD = 0xCC;
    test.SS = 0xEEFF;
    print ("defEndian", ctypes.string_at(ctypes.addressof(test), ctypes.sizeof(test)))
    test = TestBig_Struct();
    test.b1 = 1;
    test.b2 = 0;
    test.b3 = 0;
    test.b4 = 1;
    test.lev = 2;
    test.BB = 0xAA;
    test.BC = 0xBB;
    test.BD = 0xCC;
    test.SS = 0xEEFF;
    print ("BigEndian", ctypes.string_at(ctypes.addressof(test), ctypes.sizeof(test)))
    ctypes.memmove(ctypes.addressof(test), b'\x92\xaa\xbb\xcc\xee\xff', ctypes.sizeof(test));
    print ("b1:%x"%test.b1)
    print ("b2:%x"%test.b2)
    print ("b3:%x"%test.b3)
    print ("b4:%x"%test.b4)
    print ("lev:%x"%test.lev)
    print ("BB:%x"%test.BB)
    print ("BC:%x"%test.BC)
    print ("BD:%x"%test.BD)
    print ("SS:%x"%test.SS)
    with open("out.bin", "wb") as f:
        f.write(ctypes.string_at(ctypes.addressof(test), ctypes.sizeof(test)));

从上面的实例，可以看出来，这个就是采用类似与C结构体的方式，直接解析映射来解析和组装数据。十分的强大。这个实例程序的运行结果如下。

defEndian b')\xaa\xbb\xcc\xff\xee'
BigEndian b'\x92\xaa\xbb\xcc\xee\xff'
b1:1
b2:0
b3:0
b4:1
lev:2
BB:aa
BC:bb
BD:cc
SS:eeff

其中out.bin文件中保存的数据，以十六进制查看如下：

92 aa bb cc ee ff

opencv图像处理机器学习真实项目教程(python实现)1计算机视觉简介

1 计算机视觉简介欢迎来到计算机视觉的世界。本书将带您踏上令人兴奋且快速发展的计算机视觉和图像处理世界的旅程。本书首先介绍计算机视觉和OpenCV库。然后，我们将继续介绍本课程的基本库和所需的环境设置。主要内容：计算机视觉简介计算机视觉的应用 Python OpenCV OpenCV简史 ...阅读全文

Spring Boot学习随笔- 实现AOP（JoinPoint、ProceedingJoinPoint、自定义注解类实现切面）

这篇笔记深入介绍了AOP（面向切面编程），这个技术可以在代码中以模块化的方式实现横切关注点。它解决了业务层代码中存在的问题，如额外功能代码的冗余和每个方法都需要书写一遍额外功能代码的情况。 AOP在Spring中的实现主要依靠Aspect切面、Advice通知和Pointcut切入点的组合。Advi... ...阅读全文

浅析 ArrayList

ArrayList是一个使用List接口实现的Java类。顾名思义，Java ArrayList提供了动态数组的功能，其中数组的大小不是固定的。它实现了所有可选的列表操作，并允许所有元素，包括null。 ...阅读全文

10 个免费的 AI 图片生成工具分享

原文： https://openaigptguide.com/ai-picture-generator/ 在人工智能（AI）图像生成技术的推动下，各类AI图片生成网站如雨后春笋般涌现，为我们的日常生活提供了丰富多彩的视觉体验。 AI图片生成技术原理人工智能（AI）图片生成技术原理是通过计算机程序使 ...阅读全文

C++移动构造与std::move()

背景及问题如下程序所示： #include<iostream> class MyString { public: MyString() = default; MyString(const char* data) { printf("%s", "MyString Constructed!!\n"); ...阅读全文

【流式传输】使用Spring Boot实现ChatGpt流式传输

引言在ChatGpt火了这么久，他的那种单字单字返回的格式可能让很多朋友感到好奇，在之前我用c#写了一个版本的，同时支持IAsyncEnumerable以及SSE，今天把之前写的Java版本的也发出来，和大家一起学习，有不对的地方，欢迎各位大佬指正。 Code 我这边用的是JDK21版本，可以看到 ...阅读全文

Python给exe添加以管理员运行的属性

需求有些应用每次启动都需要用管理员权限运行，比如Python注入dll时，编辑器或cmd就需要以管理员权限运行，不然注入就会失败。这篇文章用编程怎么修改配置实现打开某个软件都是使用管理员运行，就不用每次都右键点击以管理员身份运行此程序。主要是给小白配置，防止他忘了以管理员权限运行，又跑过来问我为 ...阅读全文

C++ Qt开发：TableWidget表格组件

Qt 是一个跨平台C++图形界面开发库，利用Qt可以快速开发跨平台窗体应用程序，在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置，实现图形化开发极大的方便了开发效率，本章将重点介绍`TableWidget`表格组件的常用方法及灵活运用。`QTableWidget` 是 Qt 中用于显示表格数据... ...阅读全文

C++ Qt开发：MdiArea多窗体组件

QMdiArea（Multiple Document Interface Area）是Qt中用于创建多文档界面的组件。它提供了一种在单个窗口中管理多个文档的方式，每个文档通常是一个子窗口（`QMdiSubWindow`）。该组件主要用于设计多文档界面应用程序，具备有多种窗体展示风格，实现了在父窗体中... ...阅读全文

35. 干货系列从零用Rust编写负载均衡及代理，代理服务器的源码升级改造

代理在计算机网络很常见，比如服务器群组内部通常只会开一个口进行对外访问，就可以通过内网代理来进行处理，从而更好的保护内网服务器。代理让我们网络更安全，但是警惕非正规的代理可能会窃取您的数据。请用HTTPS内容访问更安全。 ...阅读全文