坚持开源、能力内化,中移苏研荣获“中国开源领军企业”大奖!

6月21日,2018年 OpenInfra Days China在北京国家会议中心开幕,国内OpenStack相关领域最大盛会拉开序幕,据统计,超过2000余名技术专家和行业用户参与了本次盛会。中国移动苏州研发中心凭借在开源领域的卓越贡献,荣获“开源云领军企业”大奖!

中国移动苏州研发中心始终坚持"深度参与社区,积极回馈社区"的研发理念,并将“全面引领社区”作为后续的发展目标,深度参与Linux、OpenStack、Ceph、Gluster、Kubernetes、Hadoop等开源社区并积极支持OpenStack Summit、OpenInfra Days China、Open Source Cloud Hackathon等行业大会,以开源软件架构为基础构建了“BigCloud-大云”产品体,结合运营商IT环境规模大、系统复杂、业务要求高、定制化需求多等特点,对开源软件深度定制开发,尤其在高扩展性、高可靠性、高性能、高标准化等产品化方面能力,获得了客户和业界的充分肯定。

一、盛会总结,新人辈出

6月第三周对苏研的小伙伴来说,是充满新奇、欣喜,激动、激情并且大丰收的一周。6月19日苏研7人小分队参加了第八届开源黑客松活动,一共提交26个patch,其中一人获得最佳新人,两人获得最佳评审,更值得欣喜的是,苏研的新人逐渐在社区展露头角,除OpenStack Tacker Core Reviewer 闫兴安同学外,其他都是16、17年校园新人(张绍文-2016,吕舒华-2016,李宙洲-2017,苗玉良-2017,李佳乐-2017,徐磊-2017),好的平台加上自身的努力,必将加速人才的成长。6月22日苏研5人小分队参加OpenInfra Days China,代表苏研领取了2018中国十大”开源云领军企业“大奖,同时带来了两场苏研云平台建设实践经验分享,针对大规模场景下OpenStack调度器和消息队列优化作了深入的分析,并给出了参考建议。

1.《移动大云OpenStack针对Nova-Placement服务的研究与优化》,徐磊(裸机一哥)

2.《优化Rabbitmq在OpenStack项目中的实践》,杨巍巍(RabbitMQ/KeyStone一姐)

二、欣喜现在成绩,不忘过去历史

鉴于很多人央企体制下的苏研很好奇,也多次听到很多大的国企都在给集团(或母公司)汇报材料中以“苏研模式”为标杆,力推自主研发,所以花点篇幅介绍下中国移动苏州研发中心。

中移(苏州)软件技术有限公司(对内称“中国移动苏州研发中心”),中国移动全资子公司,位于江苏省苏州市高新区科技城中移软件园,整个园区占地600亩(包含120亩的天然湖),建筑面积36万平,现有员工1000人左右,远期规划4500人,下辖四个支撑中心(北京、上海、广州、成都),三个产品部(云计算产品部、大数据产品部、IT产品部),一个运营支撑部和若干职能管理部门,主要从事云计算、大数据、IT支撑系统和部分应用产品的市场推广、开发与应用、技术咨询和售后支持等工作,是中国移动IT能力内化和业务创新发展的中坚力量。

自2007年中国移动启动“BigCloud-大云”云计算研究计划,研究大规模分布式计算技术,2008年完成团队组建和试验设施搭建,2009年建成由1024台服务器构成的业界最大云计算技术实验室。2010年在首届云计算大会上正式发布“大云”1.0云计算系列产品,研发的大云虚拟化(BC-EC,基于OpenNebula+KVM技术架构)和云存储(BC-oNest,完全自主设计的对象存储产品)产品用于中国移动公有云建设,此后,大云获得了大量的应用案例。2014年3月,中国移动苏州研发中心注册成立,云计算产品部团队规模由最初的不到20人,于2014年底发展到70人左右。2015年12月基于OpenStack架构和SDN技术的中国移动公有云试商用,部署规模1000台物理服务器,应该是国内首个OpenStack+SDN的商用案例(或者首个公有云商用案例),也应该是当时国内最大的OpenStack商用集群,并于2016年上线了采用Ceph架构的对象存储产品,单集群做到了150个节点,接近2000个OSD,总容量超过40PB,应该是当时最大的Ceph集群。2016年10月,凭借OpenStack大规模商用案例以及对社区的贡献,中国移动苏州研发中心正式成为OpenStack黄金会员,并成为中国首个OpenStack SuperUser。随着能力的不断积累,2017年苏州研发中心为中国移动建设了国内(有可能是全球)最大的裸金属云计算集群(异地两池6000个节点,其中4500个裸机节点,1500个虚拟化节点),并且实现了虚拟机、裸机统一组网的SDN集群,截至目前应该也是已知的最大的裸机+SDN商用集群。最后展示下OpenStack团队的发展历程,继承自前面提到的BC-EC产品团队,也是我职业生涯带的第一个团队。

三、开源大势所趋,更需冷静思考(仅代表个人观点,一家之言而已)

不管是一朵云,还是两朵云的噱头,都无法违背开源大势所趋的客观规律。在2016年就听过某市场份额超过后面几家之和的掌门人说过一句话,虽记不住原话,但是愿意经常能够不自觉地想起:“世界上做的成功的云,就没有基于开源来实现的 ”,暂且不讨论开源的定义是什么,但是一直不是很认同。首先,基于开源架构做云,一点也不丢人,所以经常会在各种场合分享基于开源的一些实践经验,尽管目前偏工程的经验更多,但是基于开源,我很自豪;其次,目前没有成功,不代表我就做不成功,可以以史为鉴,但并不代表踏着成功者的经验就能成功。

去年在中国移动云计算大会的时候做过一个统计,与大家分享下,免得被人诟病,闭门造成,不抬头看路。

下面讲讲对几个被客户经常问到的问题的看法。

1. PaaS是否会取代IaaS,或者Kubernetes是否会取代OpenStack?

这个问题其实从某些角度讲,可能会有不同的答案,诉求和出发点不一样而已,但是从一个云平台的建设者和维护者的全局角度来看,我的观点是:IaaS与PaaS需要统筹规划,并协调发展。OpenStack的定义写的特别好,只不过有很长一段时间,OpenStack由于风头太盛,有点迷失了而已。还是借用去年一次技术分享来表达我的观点。

OpenStack的定义很明确,它就是一个将计算、存储、网络等资源的池化,管理员可以将控制权限授权给用户实现自服务的云操作系统,这里有两个很重要概念:资源池化和资源管理,其实通常还会隐含一个共性需求:统一,统一池化/统一管理。

(1)计算资源,如虚拟机、裸机,甚至小机,HPC,GPU,TPU,FGPA等资源统一池化和管理,其中对于虚拟机,又涉及到异构虚拟化,存量的VMWare,XenServer等异构技术和异构厂商。

(2)存储资源,如分布式块/文件/对象存储、磁阵(IP-SAN/FC-SAN),NAS设备、带库等资源统一池化和管理

(3)网络资源,如网络设备,异厂家的SDN方案等统一管理

(4)安全资源,如软件安全设备,硬件安全设备等异常家统一池化和管理

所有这些资源的资产管理,监控指标采集,故障分析和告警,统一运维和运营等等,虽然很多OpenStack也没有实现,但是OpenStack至少实现绝大多数资源管理,并且有个很好的框架可扩充,到这里可以下个结论,OpenStack做好IaaS就可以了,之前一时冲动,搞了很多PaaS,甚至SaaS的东西,是该下决心砍掉的时候了(比如说magnum,murano,甚至是sahara,trove),或者全力去支撑其他社区做的更好。

PaaS的并没有很明确的定义,我这里给了一个自己理解的定义仅供参考,核心观念就是以应用为中心,将应用开发和运行依赖的软件环境能力化,服务化。

所以最理想的结论就是:IaaS和PaaS在建设的时候就要统一规划,协同发展。这里再提一个分层建设的理念,就是所有资源统一由IaaS层来管理,PaaS通过API向IaaS申请所需的资源,形成分层的两个管理界面:IaaS管理平台和PaaS管理平台,具体实现上可以是一个CMP两个门户或者两个中心。之所以强调分层建设的理念,是很多人忽略了一个很重要的问题:组织架构,一个公司,一个部门,都是由清晰的组织架构职责的,所以云平台的建设一定要服从组织架构的定义的社会分工和职责。其实这部分,要谈的东西很多很多,限于篇幅先写到这,有需要可以组织其他交流活动。

2. 开源产品门槛低,招几个人就可以凑合着用,或者有了开源,是否还需要专业服务商的问题?

这个问题表面比较好回答,比如如果招几个人就能干,那还需要RedHat,或者华为这种公司干什么?但是一般互联网公司估计又感觉招几个人确实能干,而且干得还不错。之前也多次说过一个问题:自研自用自嗨型公司,一般大多以互联网公司居多,这里并没有鄙视意思, 首先这些互联网公司自研自用自嗨,确实做得非常好,一个很小的团队,就能把一款开源软件用到极致,甚至完全转化成自己的核心竞争力,但是这里面有个很大的问题 - 产品化的问题。自研自用型产品,需要强调的运维团队,而传统企业在这方面一般靠代维活着,或者自由人员能力比较差,这就必须要求产品化程度非常高,并且简单傻瓜易用,这进而就会影响产品的整体设计,人为的使产品变得非常复杂,大大提高了产品的研发和交付成本,所以,传统企业做自主研发,拿华为当标杆会更接地气,发展也会更为顺利。一些巨头互联网公司兵败政务云,大型企业私有云可能需要考虑下这方面原因,并且有些公司已经在将自己公有云产品,比如存储等产品进行产品化。

总结下,作为传统企业,如果没有下决心投入大量自由人力做研发,还是要找好靠普的服务提供商。另外,开源社区确实在产品化方面做得太差,可能是由开源文化决定的,之前就听过某社区PTL的段子:“社区都是无偿工作,为什么不能让我干点自己想干的事情,而要去做产品的东西”。

不论OpenStack,Ceph,还是Kubernetes,离线上业务需求,都还差得太远太远,槽点几年都吐不完。

还有一些比较具体的观点,也偏犀利,限于篇幅,后续整理与大家分享,可以先做个预告:

3. CMP才是云平台的核心,是否只能由云平台建设方自主研发才能做好?

4. 网络(重点指SDN)产品并不是想做就能做,该放手还是要放手?

5. Ceph槽点多多,后续究竟应该如何发展?

如果大家有想讨论的话题,也可以反馈,最后,感谢Linux宝库给的压力,让我好多年后又开始写文章。

作者简介:

刘军卫,中国移动苏州研发中心,云计算产品部总经理助理,负责公司云计算产品规划和研发。

关于“Linux宝库”微信公众号:

欢迎关注"Linux宝库"微信公众号,这里每天发布最新的开源人物和开源事件。谨以此号记录Linux和开源业界的点点滴滴,为开源爱好者和从业者点亮人生。

- 责任编辑:耿航 -
- END -

已标记关键词 清除标记
相关推荐