Ceph开发每周谈 Vol 32|Ceph-osd on 4.x 内核异常

2016年07月 · 麦子迈

这是Ceph开发每周谈的第三十二篇文章,记录从16年7月10号到16年7月16号的社区开发情况。笔者从前年开始做Ceph的技术模块分析到今年中告一段落,想必有挺多人期待下一篇Ceph技术分析。考虑到Ceph的发展已经从前年的一穷二白到现在的如火如荼,但对于社区的方向和实况仍有所脱节,笔者考虑开始Ceph开发每周谈这个系列。每篇文章都会综述上周技术更新,围绕几个热点进行深度解析,如果正好有产业届新闻的话就进行解读,最后有读者反馈问题的话并且值得一聊的话,就附上答疑部分。

上周综述

ceph-mgr 的第一个版本已经在 Pull Request 列表上(https://github.com/ceph/ceph/pull/10328),如之前所说,ceph-mgr 主要是增强和提供集群的统计和监控能力,使用 Python 而不是 C++ 去增强这方面。会尝试把 Monitor 的一些工作解偶出来。

从上周开始 Sage 度假去了,所以 BlueStore 进度会变慢。Sam 仍然在继续为 EC Overwrite 努力。

Drop i386 Support

Kefu 提出在目前测试集群没有覆盖任何 i386 架构环境的情况下,在官方文档中正式去掉对于 i386 的支持。

download

Ceph-osd on 4.x 内核异常

最近用户报告在 4.x 内核上非常容易碰到 task_numa_find_cpu 的内核问题(https://bugzilla.kernel.org/show_bug.cgi?id=121101)。

内核开发者承诺在 4.7 rc 上修复,但是表示这个问题应该很难复现,但是 ceph-osd 的 workload 场景下却较容易。

因此,在新内核上请谨慎使用 ceph-osd。