Nautilus v14.2.5发布
这是Ceph Nautilus版本系列的第五个版本。在许多值得注意的更改中,此版本修复了
14.2.3 中引入的严重BlueStore错误。建议所有Nautilus用户升级到此版本。
显着的变化¶
关键修复:
- 此版本修复了一个重要的BlueStore错误,该错误在14.2.3中引入(并且在14.2.4中也存在),当使用单独的“ WAL”设备时,该错误可能导致数据损坏。
新的健康警告:
-
如果守护程序最近崩溃,Ceph现在将发出运行状况警告。
自Nautilus最初发布以来,Ceph 就一直在收集崩溃报告,但是
运行状况警报是新的。要查看新的崩溃(或所有崩溃,如果您刚刚
升级的话):ceph crash ls-new
要确认特定的崩溃(或所有崩溃)并使运行状况警告静音:
ceph crash archive-all
-
如果RADOS池的
pg_num
值不是2的幂,Ceph现在将发出健康警告。可以通过将池调整为附近的2的幂来解决此问题:ceph osd pool set <pool-name> pg_num <new-pg-num>
或者,可以通过以下方式使警告静音:
ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false
-
如果将RADOS池的
size
设置为1,
或者换句话说,如果该池配置为没有冗余,则Ceph将发出健康警告。
如果池大小设置为最小
建议值,则Ceph将停止发出警告:ceph osd pool set <pool-name> size <num-replicas>
可以通过以下方式使警告静音:
ceph config set global mon_warn_on_pool_no_redundancy false
-
如果平均osd心跳ping
时间超过所计算的任何间隔的可配置阈值,现在就会生成健康警告。OSD计算平均值,最小值和最大值的1分钟,5分钟和15分钟间隔。新的配置选项mon_warn_on_slow_ping_ratio指定的百分比osd_heartbeat_grace来确定阈值。零值将禁用警告。 以毫秒为单位指定的新配置选项mon_warn_on_slow_ping_time会 覆盖计算值,并在OSD心跳ping花费的时间超过指定的数量时引发警告。
新的管理命令ceph守护程序mgr。#dump_osd_network [阈值],
将列出所有ping时间长于config选项确定的指定阈值或值的所有连接,以3个间隔中任意间隔的平均值为准。
另一种新的管理命令,ceph daemon OSD。
#dump_osd_network [门槛]</cite>,
将做由指定的OSD开始同时但只包括心跳。
telemetry 模块中的更改:
-
telemetry 模块现在具有默认启用的“设备”通道,该通道将向telemetry.ceph.com报告匿名的硬盘和SSD健康指标,以构建和改进设备故障预测算法。由于telemetry 报告的内容已更改,因此您需要通过以下方式重新选择加入
:ceph telemetry on
您可以通过以下方式确切查看将首先报告哪些信息:
ceph telemetry show
ceph telemetry show device # specifically show the device channel
如果您不愿意共享设备指标,则可以先停用该频道,然后再重新启用:
ceph config set mgr mgr/telemetry/channel_device false
ceph telemetry on
-
telemetry 模块现在报告有关CephFS文件系统的更多信息,
包括:- 多少个MDS守护程序(总计和每个文件系统)
- 启用(或已启用)哪些功能
- 多少个数据池
- 文件系统的大致年龄(年份+创建月份)
- 多少个文件,字节和快照
- 缓存了多少元数据
我们还添加了:
- 监视器正在运行哪个Ceph版本
- 监视器是否使用msgr v1或v2地址
- 监视器使用的是IPv4还是IPv6地址
- 是否启用RADOS缓存分层(以及哪种模式)
- 是否复制池或对擦除进行编码,以及
正在使用哪个擦除代码配置文件插件和参数 - 集群中有多少台主机,每种类型的守护程序有多少台主机
- 是否正在使用单独的OSD群集网络
- 集群中有多少个RBD池和映像,以及有多少个池启用了RBD镜像
- 存在多少个RGW守护程序,区域和区域组;正在使用哪些RGW前端
- 有关CRUSH映射的汇总统计信息,例如使用了哪些算法,有多少个
存储桶,定义了多少个规则以及
使用了什么可调参数
如果启用了telemetry 功能,则需要使用以下选项重新加入:
ceph telemetry on
您可以通过以下方式确切查看将首先报告哪些信息:
ceph telemetry show # see everything ceph telemetry show basic # basic cluster info (including all of the new info)
OSD:
- 一个新的OSD守护程序命令“ dump_recovery_reservations”显示
在优先级队列中持有的(in_progress)和等待中的恢复锁。 - 另一个新的OSD守护程序命令“ dump_scrub_reservations”显示了
为本地(主要)和远程(副本)PG保留的清理保留。
RGW:
- RGW现在支持S3对象锁API集,允许使用WORM模型
存储对象。添加了6个新的API,放置/获取存储桶对象锁定,
放置/获取对象保留,放置/获取对象合法保留。 - RGW现在支持列表对象V2