用Python从URL中提取域名的方法

2023-09-13 16:31 由 Python探索牛发表于 #后端开发

本文将使用实际的例子来解释Python的urlparse() 函数来解析和提取URL中的域名。我们还将讨论如何提高我们解析 URL 的能力和使用它们的不同组件。

用urlparse() 从 URL 中提取域名

urlparse() 方法是Python的urllib 模块的一部分，当你需要将URL拆分成不同的组件并将它们用于不同的目的时非常有用。让我们看一下这个例子：

from urllib.parse import urlparse
component = urlparse('http://www.google.com/doodles/mothers-day-2021-april-07')
print(component)

在这个代码片断中，我们首先包含了urllib 模块中的库文件。然后，我们将一个URL传递给urlparse 函数。这个函数的返回值是一个对象，它就像一个数组，有六个元素，如下所示：

scheme – 指定我们可以用来获取在线资源的协议，例如，HTTP/HTTPS 。
netloc – net 表示网络，loc 表示位置；所以它表示URLs的网络位置。
path – 一个网络浏览器用来访问所提供的资源的特定途径。
params – 这些是path 元素的参数。
query – 遵循path 组件和数据的蒸汽，一个资源可以使用。
fragment – 它对部件进行分类。

当我们使用打印函数显示这个对象时，它将打印其组件的值。上述代码栅栏的输出将如下：

ParseResult(scheme='http', netloc='www.google.com', path='/doodles/mothers-day-2021-april-07', params='', query='', fragment='')

你可以从输出中看到，所有的URL组件都被分离出来，作为单独的元素存储在对象中。我们可以像这样通过使用其名称来获得任何组件的值：

from urllib.parse import urlparse
domain_name = urlparse('http://www.google.com/doodles/mothers-day-2021-april-07').netloc
print(domain_name)

使用netloc 组件，我们可以得到URL的域名，如下所示：

www.google.com

这样，我们可以得到我们的URL解析，并在我们的编程中使用其不同的组件来达到各种目的。

热门相关：藏娇记事楚氏赘婿嫡嫁千金重生成偏执霍少的小仙女宠物小精灵之庭树

Python中使用内存缓存

在编写Python应用程序时，缓存很重要。使用缓存来避免重新处理数据或访问一个缓慢的数据库可以提高你的性能。在Python中，我们可以使用memcached 模块来在我们的脚本中加入内存缓存。本文将讨论准备内存缓存操作和主要的memcached 使用。我们还将学习使用Pythoncache 和s ...阅读全文

Python中的函数未定义的错误

通过这个解释，我们将了解当Python程序显示类似NameError: name '' is not defined的错误时，即使该函数存在于脚本中，也会出现这种情况。我们还学习了当我们使用拼写错误的变量或没有导入的内置函数时会发生什么，以及如何在Python中避免这些错误。避免在Python声 ...阅读全文

Java实现常见查找算法

Java实现常见查找算法查找是在大量的信息中寻找一个特定的信息元素，在计算机应用中，查找是常用的基本运算，例如编译程序中符号表的查找。线性查找线性查找（Linear Search）是一种简单的查找算法，用于在数据集中逐一比较每个元素，直到找到目标元素或搜索完整个数据集。它适用于任何类型的数据集 ...阅读全文

一篇文章让你弄懂分布式一致性协议Paxos

一、Paxos协议简介 Paxos算法由Leslie Lamport在1990年提出，它是少数在工程实践中被证实的强一致性、高可用、去中心的分布式协议。Paxos协议用于在多个副本之间在有限时间内对某个决议达成共识。Paxos协议运行在允许消息重复、丢失、延迟或乱序，但没有拜占庭式错误的网络环境中， ...阅读全文

【matplotlib基础】--绘图配置

Matplotlib 提供了大量配置参数，这些参数可以但不限于让我们从整体上调整通过 Matplotlib 绘制的图形样式，这里面的参数还有很多是功能性的，和其他工具结合时需要用的配置。通过plt.rcParams，可以查看所有的配置信息： import matplotlib.pyplot as ...阅读全文

15.3K Star，超好用的开源协作式数字白板：tldraw

大家好，我是TJ 今天给大家推荐一个开源协作式数字白板：tldraw。 tldraw的编辑器、用户界面和其他底层库都是开源的，你可以在它的开源仓库中找到它们。它们也在NPM上分发，提供开发者使用。您可以使用tlDraw为您的产品创建一个临时白板，或者将其作为构建自己应用的工具来使用。在线体验 tl ...阅读全文

61基于java的学生考勤管理系统设计与实现（可参考做毕设）

基于java学生考勤管理系统设计与实现，可适用于学生考勤系统，校园考勤，大学考勤管理，企业考勤系统，公司考勤系统，学校考勤系统。 ...阅读全文

支持JDK19虚拟线程的web框架，之一：体验

随着JDK19的发布，虚拟线程也逐渐被大家了解和使用，然而，主流java框架是否支持虚拟线程这一特性呢？咱们应用开发者如何通过框架使用虚拟线程特性？经过精心准备，欣宸原创在第一时间为您带来详细的实战系列，与您共同学习 ...阅读全文

再聊Java Stream的一些实战技能与注意点

大家好，又见面了。在此前我的文章中，曾分2篇详细探讨了下JAVA中Stream流的相关操作，2篇文章收获了累计 10w+阅读、2k+点赞以及 5k+收藏的记录。能够得到众多小伙伴的认可，是技术分享过程中最开心的事情。吃透JAVA的Stream流操作，多年实践总结讲透JAVA Stream的co ...阅读全文

阿里三面：MQ 消息丢失、重复、积压问题，如何解决？

作者：美得让人心动来源：https://blog.csdn.net/gu131007416553/article/details/120934738 面试官在面试候选人时，如果发现候选人的简历中写了在项目中使用了 MQ 技术（如 Kafka、RabbitMQ、RocketMQ），基本都会抛出一个问 ...阅读全文