我们在做日志收集方案选型的时候,ops 给的方案是日志先落盘,然后再做收集。这样做有一个好处,对应用没有影响,据说其他公司有通过网络收集日志的,后来收集系统出故障导致应用 hang 住。 ops 推荐使用了 flexvolume 插件来支持可扩展 lvm 方案
学习了解:
先推荐几个经典的教程:
https://diamanti.com/flexvolume-explored/
https://github.com/kubernetes/kubernetes/tree/master/examples/volumes/flexvolume
http://leebriggs.co.uk/blog/2017/03/12/kubernetes-flexvolumes.html
官网的例子在 https://github.com/kubernetes/community/blob/master/contributors/devel/flexvolume.md
简单说,flexvolume 支持用户自定义 volume driver, 这种方式非常灵活,driver 只需要定义实现几个接口即可
- init
- attach
- detach
- mount
- unmount
官网用的 bash 定义的 lvm driver 应该是使用最广泛的,这个不限于 bash, 还可以使用其他语言实现这些接口, 使用 bash 应该是考虑通用性方面。
使用 xfs 文件系统做 lvm 遇到的坑点
虽然 lvm shell 脚本中的几个函数非常简单,但还是免不了遇到问题。我们再压测创建 100个 deployment (每一个挂一个 xfs 的lvm volume),每次压测会有一个 volume mount 失败,导致 pod 一致再 containterCreating 状态中,
通过日志发现,正在 mount 的 volume type 类型是 xfs_external_log, 通过科普发现 xfs 还有 logdev 这种 volume 类型,看一下 lvm 的实现中
VOLFSTYPE=`blkid -o udev ${DMDEV} 2>/dev/null|grep "ID_FS_TYPE"|cut -d"=" -f2`
if [ "${VOLFSTYPE}" == "" ]; then
mkfs -t ${FSTYPE} ${DMDEV} >/dev/null 2>&1
if [ $? -ne 0 ]; then
err "{ \"status\": \"Failure\", \"message\": \"Failed to create fs ${FSTYPE} on device ${DMDEV}\"}"
exit 1
fi
fi
如果发现 volume type 为空就做格式化,但是缺漏掉了 xfs_external_log 这种类型,xfs_external_log 类型也需要做初始化才能 mount 成功. 可以更改为
if [ "${VOLFSTYPE}" == "" ] || [ "${VOLFSTYPE}" == "xfs_external_log" ]
这样就避免了 xfs_external_log 类型的 volume mount 失败。
flexvolume 的插件是都在 k8s 集群外部实现的,维护没有那么方便,看官方已经有 pr 在 k8s 内部实现第三方 volume 插件的支持, 期待中 ...