Ceph开发每周谈 Vol 43|ceph-mgr 进入主线 | Hammer 升级问题

2016年10月 · 麦子迈

这是Ceph开发每周谈的第四十三篇文章,记录从16年9月25号到16年10月2号的社区开发情况。笔者从前年开始做Ceph的技术模块分析到今年中告一段落,想必有挺多人期待下一篇Ceph技术分析。考虑到Ceph的发展已经从前年的一穷二白到现在的如火如荼,但对于社区的方向和实况仍有所脱节,笔者考虑开始Ceph开发每周谈这个系列。每篇文章都会综述上周技术更新,围绕几个热点进行深度解析,如果正好有产业届新闻的话就进行解读,最后有读者反馈问题的话并且值得一聊的话,就附上答疑部分。

  • 上周综述

  • ceph-mgr 进入主线

Ceph-Mgr 在上周已经正式进入了主线,ceph-mgr 作为 Ceph 集群的管理进程,未来会负责整个集群的管理操作和监控。现在的部分 Monitor 功能会迁移到 ceph-mgr 中,使得 Monitor 更专注于集群的数据面控制,降低集群对于 Monitor 的要求。可以通过 http://docs.ceph.com/docs/master/mgr/ 来了解 ceph-mgr 的使用问题。

  • Hammer 升级问题

在最新的社区里发布了如果从 0.94.7 之前升级到 0.94.7 以上的版本,会碰到 cluster log 大量发出 osdmap crc 错误的消息。主要原因是在 0.94.7 版本中修改了 OSDMap 的 encode 方式,并且 Monitor 开始用新的 encoding 方式来发送增量的 osdmap,但是老版本的 osd 仍然会使用旧的 osdmap 进行通讯,因此会导致 crc mistach,因此 OSD 会向 Monitor 获得最新的 Monitor。

在大的 Ceph 集群中,CRC Mismatch 会导致 Monitor 收到大量的 clog 消息,和全量 OSDMap 的要求获得消息。这些会导致在网络中出现 OSDMap 的突发,影响整个集群的 IO。

因此,如果想在 0.94.7 之前升级到 0.94.7 至少,首先升级 OSD 再升级 Monitor。