快速搭建云原生开发环境（k8s+pv+prometheus+grafana）

2023-09-23 16:42 由程序员欣宸发表于 #后端开发

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码)：https://github.com/zq2599/blog_demos

本篇概览

欣宸正在为接下新的Java云原生实战系列原创做准备，既然是实战，少不了一套云原生环境，以下内容是必不可少的：

linux操作系统
kubernetes
kubernetes的外部存储，平时数据库、监控、消息这些中间件的数据不可能放在容器内，需要有个可靠的地方存起来不丢失
监控

一番操作下来，轻松完成了上述工作，这里将整个过程记录定下来，这样可以保证每次重装都能轻松愉快的完成，省下的时间用来写更多的技术原创

版本信息

本次安装的版本信息如下，供您参考

操作系统：CentOS 7.6 （腾讯云轻应用服务器）
kubernetes：1.22 （底层容器服务是docker）
prometheus：2.32.1
grafana：8.3.3

初始化

CentOS操作系统的安装就不在这里讲了，接下来的操作假设您已装好纯净的CentOS系统
本文中的操作都是用root账号执行的
安装ssh服务

sudo yum install openssh-server -y

修改root密码

sudo passwd root

修改ssh配置，允许root远程登录，文件是/etc/ssh/sshd_config，注意下图两个箭头指向的配置，确保您的值与之一致
安装常用软件：

yum install redhat-lsb lrzsz wget -y

关闭防火墙

systemctl stop firewalld && \
systemctl disable firewalld && \
setenforce 0

接下来可以安装k8s了，如果网速正常，可以采用k8s安装（在线下载镜像和文件）章节的方法，如果网络太慢，或者像我这样使用腾讯云服务器时发现下载文件太慢，可以采用k8s安装（使用离线的镜像和文件）章节的方法

k8s安装（在线下载镜像和文件）

为了简单省事儿，本次打算使用sealos安装K8S单机版，底层容器是docker
下载sealos，地址是：https://github.com/labring/sealos/releases/download/v4.1.3/sealos_4.1.3_linux_amd64.tar.gz
解压并存放到指定位置

tar -zxvf sealos_4.1.3_linux_amd64.tar.gz sealos &&  chmod +x sealos && mv sealos /usr/bin

然后一行命令安装k8s

sealos run labring/kubernetes-docker:v1.22.8-4.1.3 labring/helm:v3.8.2 labring/calico:v3.24.1 --single

等待三分钟左右，K8S单机版安装完成，控制台输出如下
查看系统pod，一切正常

[root@VM-12-12-centos k8s]# kubectl get pods -A
NAMESPACE          NAME                                       READY   STATUS    RESTARTS   AGE
calico-apiserver   calico-apiserver-67b7856948-bg2wh          1/1     Running   0          12s
calico-apiserver   calico-apiserver-67b7856948-fz64n          1/1     Running   0          12s
calico-system      calico-kube-controllers-78687bb75f-z2r7m   1/1     Running   0          41s
calico-system      calico-node-l6nmw                          1/1     Running   0          41s
calico-system      calico-typha-b46ff96f6-qqzxb               1/1     Running   0          41s
calico-system      csi-node-driver-lv2g2                      2/2     Running   0          21s
kube-system        coredns-78fcd69978-57r7x                   1/1     Running   0          47s
kube-system        coredns-78fcd69978-psjcs                   1/1     Running   0          46s
kube-system        etcd-vm-12-12-centos                       1/1     Running   0          60s
kube-system        kube-apiserver-vm-12-12-centos             1/1     Running   0          61s
kube-system        kube-controller-manager-vm-12-12-centos    1/1     Running   0          62s
kube-system        kube-proxy-x8nhg                           1/1     Running   0          47s
kube-system        kube-scheduler-vm-12-12-centos             1/1     Running   0          60s
tigera-operator    tigera-operator-6f669b6c4f-t8t9h           1/1     Running   0          46s

由于是单机版，需要去除污点才能使用，执行以下命令

kubectl taint nodes --all node-role.kubernetes.io/master-

k8s安装（使用离线的镜像和文件）

如果您通过上面一段的操作顺利装好k8s，那么这一段内容可以直接跳过
我用的是腾讯云轻应用服务器，在安装过程中发现下载sealos的文件非常慢，于是使用了以下方法来提升安装速度，如果您遇到了同样问题也可以参考这种方法
为了简单省事儿，本次打算使用sealos安装K8S单机版，底层容器是docker
在CSDN下载四个文件，它们的下载地址如下，下载后存放在CentOS服务器上的同一个目录下（不要积分，免费下载）：

https://download.csdn.net/download/boling_cavalry/86908222
https://download.csdn.net/download/boling_cavalry/86908229
https://download.csdn.net/download/boling_cavalry/86908433
https://download.csdn.net/download/boling_cavalry/86908647

确认一下，四个文件名依次是：sealos_4.1.3_linux_amd64.tar.gz、helm.tar、calico.tar、kubernetes.tar
ssh进入上述四个文件的存放目录
首先是操作sealos_4.1.3_linux_amd64.tar.gz文件

tar zxvf sealos_4.1.3_linux_amd64.tar.gz sealos && chmod +x sealos && mv sealos /usr/bin

再用sealos工具加载其他三个文件

sealos load -i kubernetes.tar
sealos load -i helm.tar
sealos load -i calico.tar

此时，再执行以下命令安装k8s

sealos run labring/kubernetes-docker:v1.22.8-4.1.3 labring/helm:v3.8.2 labring/calico:v3.24.1 --single

等待三分钟左右，K8S单机版安装完成，控制台输出如下
查看系统pod，一切正常

[root@VM-12-12-centos k8s]# kubectl get pods -A
NAMESPACE          NAME                                       READY   STATUS    RESTARTS   AGE
calico-apiserver   calico-apiserver-67b7856948-bg2wh          1/1     Running   0          12s
calico-apiserver   calico-apiserver-67b7856948-fz64n          1/1     Running   0          12s
calico-system      calico-kube-controllers-78687bb75f-z2r7m   1/1     Running   0          41s
calico-system      calico-node-l6nmw                          1/1     Running   0          41s
calico-system      calico-typha-b46ff96f6-qqzxb               1/1     Running   0          41s
calico-system      csi-node-driver-lv2g2                      2/2     Running   0          21s
kube-system        coredns-78fcd69978-57r7x                   1/1     Running   0          47s
kube-system        coredns-78fcd69978-psjcs                   1/1     Running   0          46s
kube-system        etcd-vm-12-12-centos                       1/1     Running   0          60s
kube-system        kube-apiserver-vm-12-12-centos             1/1     Running   0          61s
kube-system        kube-controller-manager-vm-12-12-centos    1/1     Running   0          62s
kube-system        kube-proxy-x8nhg                           1/1     Running   0          47s
kube-system        kube-scheduler-vm-12-12-centos             1/1     Running   0          60s
tigera-operator    tigera-operator-6f669b6c4f-t8t9h           1/1     Running   0          46s

由于是单机版，需要去除污点才能使用，执行以下命令

kubectl taint nodes --all node-role.kubernetes.io/master-

安装本地pv

本地pv的作用是给所有pvc提供存储空间
实测发现，安装本地pv的过程中，有两个镜像经常会拉取失败，建议您先下载tar到服务器，在服务器上通过docker load命令加载后再部署本地pv
请在CSDN下载两个镜像的tar文件，地址如下（不要积分，免费下载）

https://download.csdn.net/download/boling_cavalry/86908763 （下载后是个zip，解压后，文件夹里面才是真正的tar）
https://download.csdn.net/download/boling_cavalry/86908874 （下载后是个zip，解压后，文件夹里面才是真正的tar）

上述文件上传到CentOS，执行以下命令加载两个镜像

docker load < busybox.tar
docker load < local-pv.tar

下载本地pv的配置文件，地址是：https://raw.githubusercontent.com/rancher/local-path-provisioner/v0.0.22/deploy/local-path-storage.yaml
然后打开此文件，做以下四步操作
第一，如下图，删除debug哪一行
第二，找到reclaimPolicy，将其值从Delete改为Retain
第三，增加下面这句，使当前storageclass成为默认的storageclass
第四，修改下图红色箭头位置，指向您自己电脑为pv准备的位置
设置完毕后，执行命令kubectl apply -f local-path-storage.yaml即可完成本地pv的创建
如下图红色箭头，新增的pv的pod
此时，k8s环境中的pvc，都可以使用storageClass=local-path来使用本地磁盘了

安装Prometheus+Grafana（下载配置文件）

接下来会用operator的方式部署Prometheus+Grafana，这是一种非常简单使用的方法
有几个镜像下载会超时，因此改为下载国内镜像，然后用tag命令改为同名镜像即可，命令如下：

docker pull docker.io/willdockerhub/prometheus-adapter:v0.9.1

docker tag docker.io/willdockerhub/prometheus-adapter:v0.9.1 k8s.gcr.io/prometheus-adapter/prometheus-adapter:v0.9.1

docker pull bolingcavalry/kube-state-metrics:v2.3.0

docker tag bolingcavalry/kube-state-metrics:v2.3.0 k8s.gcr.io/kube-state-metrics/kube-state-metrics:v2.3.0

现在要下载operator的配置文件了，打开Prometheus operator的GitHub主页，首先确认自己的kubernetes版本应该使用哪个版本的Prometheus operator，如下图，我这里的kubernetes是1.22版本，因此使用的operator应该是release-0.9或者release-0.10
在operator的release页面，找到release-0.10版本点击下载

安装Prometheus+Grafana（修改配置文件：对外暴露服务）

接下来对下载的配置文件做些修改
首先是修改Grafana的service文件，因为默认的service是ClusterIP类型，无法从kubernetes外部访问的，这里改成集群外也可以访问service，打开文件kube-prometheus-0.10.0/manifests/grafana-service.yaml，新增箭头所指的两行，注意31330端口是我随便找的一个可用端口，您也可以随意，在30000-32767之间即可
如果想通过外部访问prometheus，可以用上述同样的方法修改prometheus-service.yaml文件
另外，如果您像我一样是将服务部署在云上（我这里是腾讯云），就涉及到公网IP的使用，请查找文件grafana-networkPolicy.yaml，如果有就删除（0.10.0-release版本没有这个文件），如果不删除，就无发通过公网IP访问grafana
对于prometheus也是一样，如果想从公网IP访问prometheus，需要删除文件prometheus-networkPolicy.yaml

安装Prometheus+Grafana（配置外部存储）

解决了外部访问的问题，接下来是存储问题了，如果不将Prometheus和grafana的数据保存在容器外部的话，只要pod被删，数据就丢失了，这在很多场景下是不可接受的
既然前面咱们已经准备好了pv，那么这里就可以把prometheus和grafana的存储改为pvc，让它们的数据保存在pv上
首先修改prometheus的存储配置，打开文件prometheus-prometheus.yaml，如下图，红框内是新增内容（稍后我会把文字贴出来便于复制）
上图红框中的内容如下

  storage:
    volumeClaimTemplate:
      spec:
        storageClassName: local-path
        resources:
          requests:
            storage: 10Gi

接着是grafana的存储，进入目录kube-prometheus-0.10.0/manifests/setup，新增名为grafana-pvc.yaml的文件，内容如下：

kind: PersistentVolumeClaim
apiVersion: v1
metadata:
  name: grafana
  namespace: monitoring
spec:
  storageClassName: local-path
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 10Gi

然后还要修改deployment配置，打开文件grafana-deployment.yaml，找到下图红色箭头所指内容
替换成下图红框中的内容

安装Prometheus+Grafana（数据采集权限）

需要给足prometheus权限，这样它才能采集到用于展示的数据，打开文件prometheus-clusterRole.yaml，新增一些权限配置，修改完毕后的完整内容如下所示，新增的位置主要在resources和varbs两处

apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  labels:
    app.kubernetes.io/component: prometheus
    app.kubernetes.io/instance: k8s
    app.kubernetes.io/name: prometheus
    app.kubernetes.io/part-of: kube-prometheus
    app.kubernetes.io/version: 2.32.1
  name: prometheus-k8s
  namespace: monitoring
rules:
- apiGroups:
  - ""
  resources:
  - nodes/metrics
  - services
  - endpoints
  - pods
  verbs:
  - get
  - list
  - watch
- nonResourceURLs:
  - /metrics
  verbs:
  - get

再执行以下操作，给prometheus增加管理员身份（可酌情选择）

kubectl create clusterrolebinding kube-state-metrics-admin-binding \
--clusterrole=cluster-admin  \
--user=system:serviceaccount:monitoring:kube-state-metrics

至此，配置已经修改完成，可以启动了

安装Prometheus+Grafana（安装和启动）

启动过程分为两步：先安装再启动
首先，回到prometheus/kube-prometheus-0.10.0目录，执行以下命令开始安装

kubectl apply --server-side -f manifests/setup

可能会遇到以下提示，我这边放心起见重复执行了一次安装命令，就没有此错误了

Error from server (NotFound): namespaces "monitoring" not found

接下来可以启动了，执行以下命令

kubectl apply -f manifests/

查看pod情况，如下图，大部分pod创建得很快，也有一两个稍微慢一点的，实测两三分钟可以全部ready
再去看看数据卷使用情况，如下图，已经分配好三个了
最后，如果您用的是云服务器，记得在公网放开端口，我这边是腾讯云服务器，放开方式如下图

访问grafana

现在可以访问grafana了，输入IP:端口，会提示输入账号密码，默认的账号密码都是admin
登录成功后会提示修改初始密码，按照提示操作即可
然后就进入grafana页面了，里面已经内置了很多监控数据，这里挑一个物理服务器信息的监控数据看看，如下图
再去看看给pv使用的服务器磁盘，如下所示，已经创建了三个文件夹，都是容器在用的

[root@VM-12-12-centos local-path-provisioner]# pwd
/opt/local-path-provisioner
[root@VM-12-12-centos local-path-provisioner]# ls -al
total 20
drwxr-xr-x  5 root root 4096 Nov  5 10:02 .
drwxr-xr-x. 7 root root 4096 Oct 31 08:29 ..
drwxrwxrwx  3 root root 4096 Nov  5 10:06 pvc-0b8b93ae-944c-4433-a904-71c00d65c8ad_monitoring_prometheus-k8s-db-prometheus-k8s-0
drwxrwxrwx  6 root root 4096 Nov  5 10:53 pvc-9a5dccda-673f-4db8-a64e-baf4df5006cf_monitoring_grafana
drwxrwxrwx  3 root root 4096 Nov  5 10:06 pvc-bccf40a7-59a5-4472-a6a3-65f4898255d6_monitoring_prometheus-k8s-db-prometheus-k8s-1

至此，k8s+pv+prometheus+grafana环境已经搭建完成，这样的环境离生产环境还差得远，但是作为日常开发和测试已经基本合格，如果您对云原生感兴趣，想要简单快速的从零开始搭建一套环境用于学习和研发，希望本文能给您提供一些参考
编写本文时，有些操作步骤参考了这位大佬的，在此表示感谢：http://www.javajun.net/posts/5019/index.html

欢迎关注博客园：程序员欣宸

学习路上，你不孤单，欣宸原创一路相伴...