从Workload中优雅隔离Pod

2024-09-05 19:46 由 leason001 发表于 #其他

线上集群中，业务跑着跑着，突然发现有个Pod上出现大量错误日志，其他的Pod是正常的，该如何处理呢？

直接删除Pod？

这样不便于保留现场，可能会影响判断问题的根因

让业务方忍一会，先排查下问题？

会被喷死

最好的方案是既让Pod停止接收流量，又保留Pod

思路：

停止接收流量

停止接收流量这个动作是通过Pod的label来实现的，通过修改label来实现。其实本质就是把Pod从endpoint中移除，这样无论是服务化，还是http都会把当前这个节点移除，不再转发流量。
当然，这里的前提是服务化和http的节点发现是基于k8s的endpoint来实现的（理论上大家都会这么干，不排除有黑科技）。

首先要主动调用服务下线的方法，理论上这个调用应该会配再Pod的prestop钩子中，这样Pod被删除的时候，会先调用这个方法，然后再删除Pod。

preStop:
    exec:
      command:
      - /bin/sh
      - -c
      - /bin/stop.sh

将Pod从Workload中移除

调用下线完毕之后，再修改Pod的标签，这个标签的修改可以让Pod脱离Workload的控制，变成孤儿Pod，注意修改Pod标签也要让service的selector选择不到这个Pod，这样Pod也就从endpoint中移除，服务发现也就感知不到这个节点了。

如果Pod是消费型业务，比如说 nsq worker，不具备主动发起下线怎么办？

这种情况，可以直接将Pod网络切断，这样Pod就无法接收流量了，切断方式也很简单，直接在Pod上加一个iptables规则，将流量全部丢弃即可。

/sbin/iptables -A INPUT -s {node_ip}/32 -j ACCEPT &&   // 允许节点访问，避免kubelet liveness检查失败
/sbin/iptables -A OUTPUT -d {node_ip}/32 -j ACCEPT &&
/sbin/iptables -A OUTPUT -s localhost -d localhost -j ACCEPT &&
/sbin/iptables -A INPUT -s localhost -d localhost -j ACCEPT &&
/sbin/iptables -A INPUT -p tcp --tcp-flags RST RST -j ACCEPT &&
/sbin/iptables -A OUTPUT -p tcp --tcp-flags RST RST -j ACCEPT &&
/sbin/iptables -A INPUT -p tcp -j REJECT --reject-with tcp-reset &&
/sbin/iptables -A OUTPUT -p tcp -j REJECT --reject-with tcp-reset"""

相关文章

【工具分享】PyWxDump v3.1.31(最新版本) - 微信聊天记录解密

工具介绍： PyWxDump是一款功能丰富的工具，主要用于获取微信账号信息（如昵称、账号、手机、邮箱和数据库密钥等）、解密微信数据库、查看和备份聊天记录。它支持多种数据库类型的合并查看，可以通过Web界面查看聊天记录，并且支持聊天记录的导出功能，如导出为html或csv格式，方便用户进行备份和查看。 ...阅读全文

2024秋软件工程课程个人作业（第一次）

软件工程课程班级链接作业要求作业链接作业目标搭建个人博客，熟练使用AI工具，自我评估并规划未来发展学号 102201312 一、个人logo文生图任务使用免费的AIGC图像生成工具为你的Github和博客园账号创建一个独特的个人Logo。推荐工具:DALL-E（相关介绍可在此处找到） ...阅读全文

AI Logo制作工具网站——LogoAI.ai

AI Logo制作工具，可通过输入文本生成Logo。可自定义颜色、字体、布局等，生成的Logo可以无水印下载。功能介绍：免费每日使用配额：每天可免费使用AI生成Logo。高级自定义选项：支持对Logo的颜色、字体、布局和图标进行自定义设计，以适应不同需求。无水印下载：生成的Logo无水印，可 ...阅读全文

世界上最大的ZIP炸弹，附下载链接

0x01 前言前段时间，有黑客在网上宣称自己制作了世界上最大的ZIP炸弹，容量达到1148857344 Quettabytes（1 Quettabyte = 1,000,000,000,000,000,000,000,000,000,000 bytes，后面有30个零）。这个数字远远超过了之前的 ...阅读全文

【工具推荐】TomcatWeakPassChecker v2.2(最新版本) - Tomcat 漏洞一键漏洞利用getshell

工具介绍：一键tomcat漏洞批量弱口令检测、后台部署war包getshell，该脚本用于检查Apache Tomcat管理页面的弱密码，并尝试通过上传自定义WAR包部署Godzilla Webshell。如果成功，将记录成功登录的信息以及获取到的Webshell地址。下载地址链接：https ...阅读全文

05 Windows批处理中的字符串和布尔数据类型

要了解在批处理中分配数据类型的第一件事是批处理不允许分配数据类型。所有批处理变量都是等效的。从本质上讲，保存数字、文本甚至布尔值的变量之间没有区别。但是，设置为数字的变量可以被视为数字，我们将在后面的文章中重点讨论这些数据类型。在本文中，在描述了所有批处理数据类型之后，我们将学习字符串和字符变量。 ...阅读全文

本来没有什么事情，删了服务器上一个文件夹，导致忙了快两个星期

我不在的大半年，大数据服务基本没问题，只过来维护过一两次 2024年大半年，大数据服务都比较稳定，我也只过来维护过一两次。8月份我又过来了，交接完离职同事的工作，本来没什么事情。 StatHub页面服务状态不刷新 StatHub是一个集群管理/应用编排/进程守护工具，可以用来高效的管理服务集群。具有 ...阅读全文

WebShell流量特征检测_哥斯拉篇

80后用菜刀，90后用蚁剑，95后用冰蝎和哥斯拉，以phpshell连接为例，本文主要是对这四款经典的webshell管理工具进行流量分析和检测。什么是一句话木马？ 1、定义顾名思义就是执行恶意指令的木马，通过技术手段上传到指定服务器并可以正常访问，将我们需要服务器执行的命令上传并执行 2、特点 ...阅读全文

【装包测试】Android应用权限授权小技巧

本周我们来探讨一下，在每次装包后打开游戏或应用，会有不少的权限授权窗口弹出，那我们一起来探讨一下如何减少该类的弹窗跳出 ...阅读全文

代码整洁之道--读书笔记(1)

代码整洁之道简介：本书是编程大师“Bob 大叔”40余年编程生涯的心得体会的总结，讲解要成为真正专业的程序员需要具备什么样的态度，需要遵循什么样的原则，需要采取什么样的行动。作者以自己以及身边的同事走过的弯路、犯过的错误为例，意在为后来者引路，助其职业生涯迈上更高台阶。本书适合所有程序员阅读， ...阅读全文