Python工具箱系列(三十九)

2023-07-31 11:40 由西安衍舆航天发表于 #后端开发

使用zlib对数据进行压缩

现实世界中，大量存在着对数据压缩的需求。为此，python内置了zlib压缩库，可以方便的对任意对象进行压缩。

下述代码演示了对字符串进行压缩：

import zlib

# 压缩一段中文
originstr = '神龟虽寿，犹有竟时；腾蛇乘雾，终为土灰。老骥伏枥，志在千里；烈士暮年，壮心不已。盈缩之期，不但在天；养怡之福，可得永年。幸甚至哉，歌以咏志。'
print(len(originstr))
str_compression = zlib.compress(originstr.encode('utf-8'), level=8)
print(len(str_compression))
print(str_compression)
decompress_str = zlib.decompress(str_compression)
print(decompress_str)
print(decompress_str.decode('utf-8')) 

# 压缩一段英文
originstr = 'The World Health Organization officially declared on Saturday that the current multi-country monkeypox outbreak outside of the traditional endemic areas in Africa has already turned into a public health emergency of international concern (PHEIC).'
print(len(originstr))
str_compression = zlib.compress(originstr.encode('utf-8'), level=8)
print(len(str_compression))
print(str_compression)
decompress_str = zlib.decompress(str_compression)
print(decompress_str)
print(decompress_str.decode('utf-8'))

运行上述代码后，会发现压缩并不一定会减少字节数，压缩的效率取决于压缩内容中的冗余程度。对于第一句的中文压缩后反而增加了字节数。但第二段英文则有明显的压缩比(246/180)。此外，在压缩时不指定level则使用缺省的压缩级别（大约是6），是一个在速度与压缩比间的平衡值。level的设定如下：

level=0，效果是不压缩。
level=1,速度最快
level=9,速度最慢，压缩比最高
level=-1，缺省值
压缩一个文件的操作类似，示例代码如下：

import zlib

def compress(inputfile,outputfile):
    with open(inputfile,'rb') as input:
        with open(outputfile,'wb') as output:
            data = input.read()
            compressdata = zlib.compress(data)
            output.write(compressdata)

def decompress(inputfile,outputfile):
   with open(inputfile,'rb') as input:
        with open(outputfile,'wb') as output:
            data = input.read()
            compressdata = zlib.decompress(data)
            output.write(compressdata)

compress(r'd:\dev\sensor.dat',r'd:\dev\sensor.zlib')
decompress(r'd:\dev\sensor.zlib',r'd:\dev\sensor_d.dat')

使用vscode的hex editor可以打开三个文件如下图所示：

首先源文件与压缩解压后的文件完全一样。其次，压缩后的文件确实小多了。最后可以看出，从某种意义上来说，压缩也相当于加密。

热门相关：冉冉心动修真界败类她热辣的秘密闺范今天也没变成玩偶呢

在同事面前炫一把，用 Docker 搭建更酷的本地开发环境！

来源：https://segmentfault.com/a/1190000043416307 以前要在本地跑一些有意思的工程和实验，都需要通过在本地装上一大堆软件来实现。最近发现有一种更酷的方式：Docker。用Docker在本地搭建开发环境有一系列显而易见的优势： - 不用依赖公司的资源，开发机 ...阅读全文

【go语言】2.4.3 Go Modules

Go Modules 是 Go 语言的官方依赖管理工具，自 Go 1.11 版本开始引入。它解决了 Go 语言在依赖管理上的一些问题，如版本控制、依赖隔离等。 ### 初始化一个新的模块你可以使用 `go mod init [module-path]` 命令来初始化一个新的模块。这将创建一个 `g ...阅读全文

后端开发必知的11个线程安全小技巧

对于从事后端开发的同学来说，线程安全问题是我们每天都需要考虑的问题。线程安全问题通俗地讲主要是在多线程的环境下，不同线程同时读和写公共资源（临界资源）导致的数据异常问题。比如：变量a=0，线程1给该变量+1，线程2也给该变量+1。此时，线程3获取a的值有可能不是2，而是1。线程3这不就获取了错误 ...阅读全文

quarkus依赖注入之二：bean的作用域

### 欢迎访问我的GitHub > 这里分类和汇总了欣宸的全部原创(含配套源码)：[https://github.com/zq2599/blog_demos](https://github.com/zq2599/blog_demos) ### 关于bean的作用域（scope） - 官方资料：ht ...阅读全文

Java中的线程池使用及原理

## 开篇-为什么要使用线程池？ Java 中的线程池是运用场景最多的并发框架，几乎所有需要异步或并发执行任务的程序都可以使用线程池。在开发过程中，合理地使用线程池能够带来 3 个好处。第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任 ...阅读全文

Java 基于Apache POI实现Excel读写操作

## 实践环境 Win10 Java JDK1.8 ## 代码实现 pom.xml配置 ```xml 4.0.0 com.shouke example 1.0 1.8 ${java.version} ${java.version} 4.1.2 org.apache.poi poi-ooxml ${p ...阅读全文

01、spdlog源码阅读——registry注册表

vs(visual stuiod)中vc++工程的Filter和Folder及vcxproj知识

## vs中创建Filter 在一个新项目中右键 - Add - New，默认只有一选项 New Filter。创建出来的Filter可以理解为是VS的过滤器(虚拟目录)，它不会在本地的磁盘上新建目录，而是修改了.filters文件，把这种目录关系记录在.filters文件中。 ![image-2 ...阅读全文

java基础——泛型

## 泛型的引入看下面这段代码： ```java private static int add(int a, int b) { System.out.println(a + "+" + b + "=" + (a + b)); return a + b; } private static float ...阅读全文

操作系统复习 MITS6.1810 lab util 记录

# lab util ## sleep 1. 介绍：主要用来熟悉下环境以及代码结构。 > - See `kernel/sysproc.c` for the xv6 kernel code that implements the `sleep` system call (look for `sys_s ...阅读全文