加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码网 (https://www.900php.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 经验 > 正文

考拉上“云”的431天:经历了怎样的“脱胎换骨”?

发布时间:2020-11-28 08:55:44 所属栏目:经验 来源:网络整理
导读:副标题#e# 摘要: 考拉上云,打造出一间云原生样板间。 天下网商记者 王安忆 黄天然 今年双11,是考拉海购加入“阿里动物园”的第二年,其成绩单备受外界关注。 加入阿里431天,考拉交出了一张漂亮的成绩单:会员规模增长104%,刷新过往双11纪录。 很多人不
副标题[/!--empirenews.page--] 摘要:考拉上云,打造出一间云原生样板间。

天下网商记者 王安忆 黄天然

今年双11,是考拉海购加入“阿里动物园”的第二年,其成绩单备受外界关注。

加入阿里431天,考拉交出了一张漂亮的成绩单:会员规模增长104%,刷新过往双11纪录。

很多人不知道,增长来之不易——2019年9月,考拉被阿里正式收购后,经历了一场“脱胎换骨”:数据库应用架构重新设计、百万级节点的容器集群大规模迁移、数据中心从杭州机房迁移到上千公里之外的张北、从基础组件到中间件全面拥抱云原生……

考拉上“云”的431天:经历了怎样的“脱胎换骨”?2019年9月29日,阿里为考拉举办了入园仪式

在这一年里,黑卡会员们买买买的同时,考拉悄无声息完成了一场数字基础设施的彻底换血。

如今,全站业务全部平稳过渡到阿里云后,考拉已栖息在一棵长在“云端”的参天大树上。

考拉上“云”的431天:经历了怎样的“脱胎换骨”?

一场大规模快速迁移

阿里收购史上,考拉体量不算最大,情况却很特殊。

网易只出售了考拉的业务,却没有出售原本支撑考拉的数字软硬件设施,比如物理机房、云端数据库等均不在其中。

因此,收购完成之后,考拉核心数据势必迎来一场大规模快速迁移。

根据阿里预定的计划,从2019年9月6日到2020年3月31日,为“考拉入园”后的半年整合期,考拉需要完成所有数据迁移,且业务不停服,一年之内,考拉需要完成云原生的战略升级。

焦灼的电商战中,业务发展等不起,但这样的速度,在阿里历史上前所未有。

“原本的历史数据和业务应用,就像是考拉的身体,现在我们需要给它换一个新的‘大脑’,重新连接起原本的数据,但不能影响它正常活动。”阿里云资深架构师吴明比喻道:“要以最快速度和最低成本完成这一任务,考拉上云是最佳方案。”

考拉上“云”的431天:经历了怎样的“脱胎换骨”?吴明(左三)和阿里工程师们

这是一场与时间赛跑的迁移,阿里和考拉都出动了最出色的工程师。

然而,第一个问题就成了难关。

考拉数据迁移的目的地远在河北省的张北数据中心,按照惯例,大规模数据迁移,都需要拉一根实体的网络专线传输数据,如果从杭州铺设专线到河北,施工成本以千万计,关键工程量还特别浩大,根本无法在半年里完成。

阿里工程师想到了一个好办法——过渡时期,可以先将阿里云杭州数据中心做接入口,然后在云上做内部链路,云端跳转之后,考拉只需从网易机房铺设一条通到阿里云杭州数据中心的专线,就可以把数据迁移去张北。

考拉上“云”的431天:经历了怎样的“脱胎换骨”?张北数据中心机房

“最后只拉了5公里专线光纤,工期一周,还把原本几千万的成本压缩到了几千元。”考拉上云架构师伏见说。

很快,工程师们又遇到了新问题。

数据迁移要求打通阿里与网易的内网,可是两家公司的防火墙都很结实,根本无法同时访问两家的内网账号。

阿里云为此孵化了一个新产品——为考拉量身定制了独立的虚拟私有云(VPC),既可以让两家公司的网络流畅互通,又能确保数据安全。

“这种全新的产品,原本开发周期需要一两个月,但是为了让考拉如期完成迁移,我们只花了一两周就完成了开发。”吴明说。

“如果是线下机房,涉及到两家公司的安全方案,很难实现这样的模式,解决这一问题,也是得益于阿里云可以快速灵活配置VPC的能力。”伏见说。

考拉上“云”的431天:经历了怎样的“脱胎换骨”?2019年11月12日,阿里巴巴集团董事局主席兼CEO张勇来到宁波保税区的考拉1号仓

网上协同挺过最关键时刻

今年1月底,考拉进入了紧张的数据迁移内测环节。

数据迁移一旦正式启动,顺利的话只需三四个小时,但要确保过程万无一失,前期需要花几个月测试和演练,从虚拟流量到真实流量,确保规避所有问题,才能正式启动。

紧要关头,疫情来了,600多位参与数据迁移的考拉工程师,春节之后被迫开始“云办公”。

“年初五就有同事打电话问我,年后大家不能去公司怎么办,要不要延迟数据迁移的时间?”伏见回忆。

伏见明白,一旦迁移推迟,考拉就会错过今年第一波的3.8女神节大促,还要延长与网易机房的合约期限,导致成本上升。

考拉上“云”的431天:经历了怎样的“脱胎换骨”?大家在“云办公”时,还不忘加油打气

“‘云上协同’有困难,但迁移不能延迟,无论如何也要顶着压力扛过去。”伏见说。

云办公的时间里,伏见成了最忙碌的“电话接线员”,有时候同时要开三个会议,手机开一个,电脑同时开两个。

其他工程师大抵如此,都是接入多个会议持续通话,以保持“云办公”时集体操作的协调统一。

数百名工程师在云上协同,哪怕一个环节没确认好或是信息理解不一致,就可能发生误操作,导致迁移后的应用功能出现差错。

2月29日晚,所有测试完毕,考拉全站迁移阿里数据中心进入最后的关键时刻。

当时尚未全面复工,原本灯火通明的阿里西溪园区,大楼内空无一人。

将近凌晨12点,伏见与数据库团队和阿里云的两位工程师来到园区,在漆黑的夜里点亮了大楼里唯一一间办公室。

(编辑:源码网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读