数据存储概述 容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。Volume是Pod中能够被多个容器访问的共享目录,它被定义在Pod上,然后被一个Pod里的多个容器挂载到具体的文件目录下,kubernetes通过Volume实现同一个Pod中不同容器之间的数据共享以及数据的持久化存储。Volume的生命容器不与Pod中单个容器的生命周期相关,当容器终止或者重启时,Volume中的数据也不会丢失。
数据存储类型
简单存储:EmptyDir、HostPath、NFS
高级存储:PV、PVC
配置存储:ConfigMap、Secret
简单存储 EmptyDir EmptyDir是最基础的Volume类型,一个EmptyDir就是Host上的一个空目录。
EmptyDir是在Pod被分配到Node时创建的,它的初始内容为空,并且无须指定宿主机上对应的目录文件,因为kubernetes会自动分配一个目录,当Pod销毁时, EmptyDir中的数据也会被永久删除。 EmptyDir用途如下:
在一个Pod中准备两个容器nginx和busybox,然后声明一个Volume分别挂在到两个容器的目录中,然后nginx容器负责向Volume中写日志,busybox中通过命令将日志内容读到控制台。
创建Volume-Emptydir.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 apiVersion: v1 kind: Pod metadata: name: volume-emptydir namespace: default spec: containers: - name: nginx image: docker.io/library/nginx:1.23.1 ports: - containerPort: 80 volumeMounts: - name: logs-volume mountPath: /var/log/nginx - name: busybox image: docker.io/library/busybox:1.35.0 command: ["/bin/sh" ,"-c" ,"tail -f /logs/access.log" ] volumeMounts: - name: logs-volume mountPath: /logs volumes: - name: logs-volume emptyDir: {}
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 [root@master yaml ] pod/volume-emptydir created [root@master yaml ] NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES volume-emptydir 2 /2 Running 0 76s 10.244 .67 .121 work1.host.com <none> <none> [root@master yaml ] ...... <h1>Welcome to nginx!</h1> ...... [root@master yaml ] 10.244 .34 .192 - - [06 /Sep/2022:12:50:33 +0000 ] "GET / HTTP/1.1" 200 615 "-" "curl/7.61.1" "-"
HostPath EmptyDir中数据不会被持久化,它会随着Pod的结束而销毁,如果想简单的将数据持久化到主机中,可以选择HostPath。HostPath就是将Node主机中一个实际目录挂在到Pod中,以供容器使用,这样的设计就可以保证Pod销毁了,但是数据依据可以存在于Node主机上。
创建Volume-Hostpath.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 apiVersion: v1 kind: Pod metadata: name: volume-hostpath namespace: default spec: containers: - name: nginx image: docker.io/library/nginx:1.23.1 ports: - containerPort: 80 volumeMounts: - name: logs-volume mountPath: /var/log/nginx - name: busybox image: docker.io/library/busybox:1.35.0 command: ["/bin/sh" ,"-c" ,"tail -f /logs/access.log" ] volumeMounts: - name: logs-volume mountPath: /logs volumes: - name: logs-volume hostPath: path: /root/logs type: DirectoryOrCreate
1 2 3 4 5 6 7 8 关于type的值的一点说明: DirectoryOrCreate 目录存在就使用,不存在就先创建后使用 Directory 目录必须存在 FileOrCreate 文件存在就使用,不存在就先创建后使用 File 文件必须存在 Socket unix套接字必须存在 CharDevice 字符设备必须存在 BlockDevice 块设备必须存在
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 [root@master yaml]# kubectl create -f Volume-Hostpath.yaml pod/volume-hostpath created [root@master yaml]# kubectl get pods volume-hostpath -n default -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES volume-hostpath 2/2 Running 0 17s 10.244.67.94 work1.host.com <none> <none> [root@master yaml]# curl 10.244.67.94 ...... <h1>Welcome to nginx!</h1> ...... [root@work1 ~]# ls /root/logs/ access.log error.log [root@work1 ~]# cat /root/logs/access.log 10.244.34.192 - - [06/Sep/2022:12:57:39 +0000] "GET / HTTP/1.1" 200 615 "-" "curl/7.61.1" "-"
NFS HostPath可以解决数据持久化的问题,但是一旦Node节点故障了,Pod如果转移到了别的节点,又会出现问题了,此时需要准备单独的网络存储系统,比较常用的用NFS、CIFS。NFS是一个网络文件存储系统,可以搭建一台NFS服务器,然后将Pod中的存储直接连接到NFS系统上,这样的话,无论Pod在节点上怎么转移,只要Node跟NFS的对接没问题,数据就可以成功访问。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 [root@master ~]# yum -y install rpcbind nfs-utils [root@master ~]# mkdir /root/data/nfs -pv mkdir : created directory '/root/data' mkdir : created directory '/root/data/nfs' [root@master ~]# vim /etc/exports [root@master ~]# more /etc/exports /root/data/nfs 192.16.1.0/24(rw,no_root_squash) [root@master ~]# systemctl enable --now rpcbind&&systemctl enable --now nfs-server Created symlink /etc/systemd/system/multi-user.target.wants/rpcbind.service → /usr/lib/systemd/system/rpcbind.service. Created symlink /etc/systemd/system/multi-user.target.wants/nfs-server.service → /usr/lib/systemd/system/nfs-server.service. [root@master ~]# exportfs -r [root@work1 ~]# yum -y install nfs-utils [root@work2 ~]# yum -y install nfs-utils [root@work1 ~]# showmount -e master.host.com Export list for master.host.com: /root/data/nfs 192.16.1.0/24 [root@work2 ~]# showmount -e master.host.com Export list for master.host.com: /root/data/nfs 192.16.1.0/24
创建Volume-Nfs.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 apiVersion: v1 kind: Pod metadata: name: volume-nfs namespace: default spec: containers: - name: nginx image: docker.io/library/nginx:1.23.1 ports: - containerPort: 80 volumeMounts: - name: logs-volume mountPath: /var/log/nginx - name: busybox image: docker.io/library/busybox:1.35.0 command: ["/bin/sh" ,"-c" ,"tail -f /logs/access.log" ] volumeMounts: - name: logs-volume mountPath: /logs volumes: - name: logs-volume nfs: server: 192.16 .1 .10 path: /root/data/nfs
1 2 3 4 5 6 7 8 9 10 11 12 13 [root@master yaml]# kubectl create -f Volume-Nfs.yaml pod/volume-nfs created [root@master yaml]# kubectl get pods volume-nfs -n default NAME READY STATUS RESTARTS AGE volume-nfs 2/2 Running 0 9s [root@master yaml]# ls /root/data/nfs/ access.log error.log
高级存储 前面已经介绍了NFS提供存储,此时就要求用户会搭建NFS系统,并且会在yaml配置nfs。由于kubernetes支持的存储系统有很多,要求客户全都掌握,显然不现实。为了能够屏蔽底层存储实现的细节,方便用户使用, kubernetes引入PV和PVC两种资源对象。PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创建和配置,它与底层具体的共享存储技术有关,并通过插件完成与共享存储的对接。
PVC(Persistent Volume Claim)是持久卷声明的意思,是用户对于存储需求的一种声明。换句话说,PVC其实就是用户向kubernetes系统发出的一种资源需求申请。
使用了PV和PVC之后,工作可以得到进一步的细分:
存储:存储工程师维护
PV:kubernetes管理员维护
PVC:kubernetes用户维护
PV PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创建和配置,它与底层具体的共享存储技术有关,并通过插件完成与共享存储的对接。
PV是存储资源的抽象,下面是是资源清单格式
1 2 3 4 5 6 7 8 9 10 11 apiVersion: v1 kind: PersistentVolume metadata: name: pv2 spec: nfs: capacity: storage: 2Gi accessModes: storageClassName: persistentVolumeReclaimPolicy:
目前只支持存储空间的设置( storage=1Gi ),不过未来可能会加入IOPS、吞吐量等指标的配置
访问模式(accessModes)
用于描述用户应用对存储资源的访问权限,访问权限包括下面几种方式:
ReadWriteOnce(RWO):读写权限,但是只能被单个节点挂载
ReadOnlyMany(ROX): 只读权限,可以被多个节点挂载
ReadWriteMany(RWX):读写权限,可以被多个节点挂载
需要注意的是,底层不同的存储类型可能支持的访问模式不同
回收策略(persistentVolumeReclaimPolicy)
当PV不再被使用了之后,对其的处理方式。目前支持三种策略:
Retain (保留) 保留数据,需要管理员手工清理数据
Recycle(回收) 清除 PV 中的数据,效果相当于执行 rm -rf /thevolume/*
Delete (删除) 与 PV 相连的后端存储完成 volume 的删除操作,当然这常见于云服务商的存储服务
需要注意的是,底层不同的存储类型可能支持的回收策略不同
存储类别
PV可以通过storageClassName参数指定一个存储类别
状态(status)
一个 PV 的生命周期中,可能会处于4中不同的阶段:
Available(可用): 表示可用状态,还未被任何 PVC 绑定
Bound(已绑定): 表示 PV 已经被 PVC 绑定
Released(已释放): 表示 PVC 被删除,但是资源还未被集群重新声明
Failed(失败): 表示该 PV 的自动回收失败
使用NFS作为存储,来创建PV,NFS配置如下
1 2 3 4 5 6 7 8 9 10 11 12 13 [root@master ~ ] /root/data/pv1 192.16 .1 .0 /24(rw,no_root_squash) /root/data/pv2 192.16 .1 .0 /24(rw,no_root_squash) /root/data/pv3 192.16 .1 .0 /24(rw,no_root_squash) [root@master ~ ] [root@work1 ~ ] Export list for 192.16.1.10: /root/data/pv3 192.16 .1 .0 /24 /root/data/pv2 192.16 .1 .0 /24 /root/data/pv1 192.16 .1 .0 /24
创建Pv-Env.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 apiVersion: v1 kind: PersistentVolume metadata: name: pv1 spec: capacity: storage: 1Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /root/data/pv1 server: 192.16 .1 .10 --- apiVersion: v1 kind: PersistentVolume metadata: name: pv2 spec: capacity: storage: 2Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /root/data/pv2 server: 192.16 .1 .10 --- apiVersion: v1 kind: PersistentVolume metadata: name: pv3 spec: capacity: storage: 3Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /root/data/pv3 server: 192.16 .1 .10
1 2 3 4 5 6 7 8 9 10 11 12 [root@master yaml]# kubectl create -f Pv-Env.yaml persistentvolume/pv1 created persistentvolume/pv2 created persistentvolume/pv3 created [root@master yaml]# kubectl get pv NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE pv1 1Gi RWX Retain Available 23s pv2 2Gi RWX Retain Available 23s pv3 3Gi RWX Retain Available 23s
PVC PVC(Persistent Volume Claim)是持久卷声明的意思,是用户对于存储需求的一种声明。换句话说,PVC其实就是用户向kubernetes系统发出的一种资源需求申请。
PVC是资源的申请,用来声明对存储空间、访问模式、存储类别需求信息。下面是是资源清单格式
1 2 3 4 5 6 7 8 9 10 11 12 apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc namespace: dev spec: accessModes: selector: storageClassName: resources: requests: storage: 5Gi
用于描述用户应用对存储资源的访问权限
创建Pvc-Basic.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc1 namespace: default spec: accessModes: - ReadWriteMany resources: requests: storage: 1Gi --- apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc2 namespace: default spec: accessModes: - ReadWriteMany resources: requests: storage: 1Gi --- apiVersion: v1 kind: PersistentVolumeClaim metadata: name: pvc3 namespace: default spec: accessModes: - ReadWriteMany resources: requests: storage: 1Gi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 [root@master yaml]# kubectl create -f Pvc-Basic.yaml persistentvolumeclaim/pvc1 created persistentvolumeclaim/pvc2 created persistentvolumeclaim/pvc3 created [root@master yaml]# kubectl get pvc -n default -o wide NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE pvc1 Bound pv1 1Gi RWX 34s Filesystem pvc2 Bound pv2 2Gi RWX 34s Filesystem pvc3 Bound pv3 3Gi RWX 34s Filesystem [root@master yaml]# kubectl get pv -o wide NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE pv1 1Gi RWX Retain Bound default/pvc1 15m Filesystem pv2 2Gi RWX Retain Bound default/pvc2 15m Filesystem pv3 3Gi RWX Retain Bound default/pvc3 15m Filesystem
Pod使用Pvc作为存储,创建Pvc-Pod.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 apiVersion: v1 kind: Pod metadata: name: pvc-pod1 namespace: default spec: containers: - name: busybox image: docker.io/library/busybox:1.35.0 command: ["/bin/sh" ,"-c" ,"while true;do echo pod1 >> /root/out.txt; sleep 10; done;" ] volumeMounts: - name: volume mountPath: /root/ volumes: - name: volume persistentVolumeClaim: claimName: pvc1 readOnly: false --- apiVersion: v1 kind: Pod metadata: name: pvc-pod2 namespace: default spec: containers: - name: busybox image: docker.io/library/busybox:1.35.0 command: ["/bin/sh" ,"-c" ,"while true;do echo pod2 >> /root/out.txt; sleep 10; done;" ] volumeMounts: - name: volume mountPath: /root/ volumes: - name: volume persistentVolumeClaim: claimName: pvc2 readOnly: false
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 [root@master yaml]# kubectl create -f Pvc-Pod.yaml pod/pvc-pod1 created pod/pvc-pod2 created [root@master yaml]# kubectl get pods -n default -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES pvc-pod1 1/1 Running 0 27s 10.244.67.75 work1.host.com <none> <none> pvc-pod2 1/1 Running 0 27s 10.244.67.90 work1.host.com <none> <none> [root@master yaml]# kubectl get pv -n dev -o wide NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE VOLUMEMODE pv1 1Gi RWX Retain Bound default/pvc1 21m Filesystem pv2 2Gi RWX Retain Bound default/pvc2 21m Filesystem pv3 3Gi RWX Retain Bound default/pvc3 21m Filesystem [root@master yaml]# cat /root/data/pv1/out.txt pod1 pod1 pod1 [root@master yaml]# cat /root/data/pv2/out.txt pod2 pod2 pod2
生命周期 PVC和PV是一一对应的,PV和PVC之间的相互作用遵循以下生命周期:
资源供应 :管理员手动创建底层存储和PV
资源绑定 :用户创建PVC,kubernetes负责根据PVC的声明去寻找PV,并绑定
在用户定义好PVC之后,系统将根据PVC对存储资源的请求在已存在的PV中选择一个满足条件的
PV一旦绑定到某个PVC上,就会被这个PVC独占,不能再与其他PVC进行绑定了
资源使用 :用户可在pod中像volume一样使用pvc
Pod使用Volume的定义,将PVC挂载到容器内的某个路径进行使用。
资源释放 :用户删除pvc来释放pv
当存储资源使用完毕后,用户可以删除PVC,与该PVC绑定的PV将会被标记为“已释放”,但还不能立刻与其他PVC进行绑定。通过之前PVC写入的数据可能还被留在存储设备上,只有在清除之后该PV才能再次使用。
资源回收 :kubernetes根据pv设置的回收策略进行资源的回收
对于PV,管理员可以设定回收策略,用于设置与之绑定的PVC释放资源之后如何处理遗留数据的问题。只有PV的存储空间完成回收,才能供新的PVC绑定和使用
配置存储 ConfigMap ConfigMap是一种比较特殊的存储卷,它的主要作用是用来存储配置信息的。
创建Cm-Basic.yaml,内容如下:
1 2 3 4 5 6 7 8 9 apiVersion: v1 kind: ConfigMap metadata: name: configmap namespace: default data: info: | username:admin password:123456
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 [root@master yaml]# kubectl create -f Cm-Basic.yaml configmap/configmap created [root@master yaml]# kubectl describe cm configmap -n default Name: configmap Namespace: default Labels: <none> Annotations: <none> Data ==== info: ---- username:admin password:123456 BinaryData ==== Events: <none>
创建Cm-Pod.yaml来使用Cm,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 apiVersion: v1 kind: Pod metadata: name: cm-pod namespace: default spec: containers: - name: nginx image: docker.io/library/nginx:1.23.1 volumeMounts: - name: config mountPath: /configmap/config volumes: - name: config configMap: name: configmap
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 [root@master yaml]# kubectl create -f Cm-Pod.yaml pod/cm-pod created [root@master yaml]# kubectl get pod cm-pod -n default NAME READY STATUS RESTARTS AGE cm-pod 1/1 Running 0 13s [root@master yaml]# kubectl exec -it cm-pod -n default /bin/sh kubectl exec [POD] [COMMAND] is DEPRECATED and will be removed in a future version. Use kubectl exec [POD] -- [COMMAND] instead. info username:admin password:123456
Secret 在kubernetes中,还存在一种和ConfigMap非常类似的对象,称为Secret对象。它主要用于存储敏感信息,例如密码、秘钥、证书等等。
1 2 3 4 5 [root@master yaml]# echo -n 'admin' | base64 YWRtaW4= [root@master yaml]# echo -n '123456' | base64 MTIzNDU2
创建Secret-Basic.yaml,内容如下
1 2 3 4 5 6 7 8 9 apiVersion: v1 kind: Secret metadata: name: secret namespace: default type: Opaque data: username: YWRtaW4= password: MTIzNDU2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 [root@master yaml]# kubectl create -f Secret-Basic.yaml secret/secret created [root@master yaml]# kubectl describe secret -n default Name: secret Namespace: default Labels: <none> Annotations: <none> Type: Opaque Data ==== password: 6 bytes username: 5 bytes
创建Secret-Pod.yaml,内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 apiVersion: v1 kind: Pod metadata: name: secret-pod namespace: default spec: containers: - name: nginx image: docker.io/library/nginx:1.23.1 volumeMounts: - name: config mountPath: /secret/config volumes: - name: config secret: secretName: secret
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 [root@master yaml]# kubectl create -f Secret-Pod.yaml pod/secret-pod created [root@master yaml]# kubectl get pod secret-pod -n default NAME READY STATUS RESTARTS AGE secret-pod 1/1 Running 0 68s [root@master yaml]# kubectl exec -it secret-pod /bin/sh -n default kubectl exec [POD] [COMMAND] is DEPRECATED and will be removed in a future version. Use kubectl exec [POD] -- [COMMAND] instead. password username admin 123456