-
UID:12641
-
- 注册时间2013-11-16
- 最后登录2023-11-02
- 在线时间364小时
- 配偶单身
-
-
- 发帖682
- 搜Ta的帖子
- 精华0
- 铜币48325
- 威望621
- 贡献值20
- 银元28073
-
访问TA的空间加好友用道具
- 发帖
- 682
- 铜币
- 48325
- 威望
- 621
- 贡献值
- 20
- 银元
- 28073
|
阿里云 P
VV \@ 3pq&TYQU
世事安稳,岁月静好。 G?8,&jP~T ##yi^;3Y 电影里才有疯子。麦克墨菲在疯人院里带领一群精神病人揭竿而起,怼天怼地;饿了三天的黑皮为了抢一口面包被店主追上高架桥,末路狂奔;杰克和泰勒在午夜的搏击俱乐部里挥拳相向,鲜血淋漓。屏幕对面,我们把爆米花塞进嘴里,哭成狗或者笑成狗。电影散场,各自回家。 cV)C:!W2
})ss. 真正的疯子,从来不看电影。 XlB`Z81j )zen"](cze 他们把别人的目光变成聚光灯,把自己的生活变成真人秀,手提钢刀用肉身串演一个浓重的角色。他们的人生结局无外乎两种:黄袍加身,或者玉石俱焚。 +h[$\_y O7q-MeMM 阿里云这群疯子,就用56度的荷尔蒙,在横跨十年的悠长画布上涂抹了这样一个故事。 JNk
]$ xz @\[&_DZ %.[GR
(1)一个大问题 KWhw@y-5j@
U7
Z_ 2008年9月,王坚加入阿里巴巴。
+mV4Ty 3LX<&."z 马云把他从微软亚洲研究院常务副院长的位置挖来,是因为阿里巴巴面临一个重大的危机——公司的“脑力”快不够用了。 ggX'`bK SOeL@!_ 阿里巴巴的“脑力”,其实就是“计算力”。 L42C< wCc:HfmjJ 几亿用户无论是在淘宝剁手,还是支付宝上转账,这一切都要靠巨大的计算力来思考、记忆。 SAXjB;VH6 恰恰和人一样: o),i2 如果这个“大脑”记忆被填满,就没办法储存新的商品和交易记录。 rWSw1(sAA 如果这个“大脑”思维速度跟不上,就没有办法让用户及时下单、付款。 2008年,中国虽然已经加入 WTO,还把国际友人请来热热闹闹地开了一次奥运会,但在科技领域仍然是个标准的“三无”国家:没有自己的操作系统,没有自己的芯片,同样没有自己的计算力系统。所以,购买国外成熟的设备和系统,几乎是 BAT 和所有大国企的唯一选择。 ~@L$}Eu 0
UlaB
sv 国外的东西,无外乎“IOE”这三样标配: >*Y~I0> ,/JrQWgD I(IBM,服务器提供商,他们提供的服务器俗称“小型机”) 1kTJMtZG~ O(Oracle,数据库提供商,他们的软件是著名的“甲骨文商业数据库”) DhkzVp_ E(EMC,存储设备提供商,他们提供的是“集中式存储”)。 鲜有人知,那时的阿里像依赖氧气一样依赖 IOE。 5/Swn9vwl tQ] R@i 一个支付宝的同事给了我翻出了当年的数据:2008年,在阿里的IT架构中,淘宝和支付宝使用的绝大部分都是 IBM 小型机、Oracle 商业数据库以及 EMC 集中式存储。 v,1.n{!;
:E'38~ 当年用户激增,数据越来越多,每天早上八点到九点半之间,服务器的处理器使用率都会飙升到 98%。离爆棚就差两个百分点。 \+S~N:@><k oREZ^pE@ 阿里巴巴就像赛道上的跑车:速度飞快,但引擎已经发红,再踩几脚油估计就要冒烟,后果不堪设想。 %VSST?aUvX _.wLQL~y 可能连马云自己都没有想到,阻碍阿里巴巴增长最迫切的阻力不是商场上的博弈、不是政策的变化,而居然是 IT 基础设施的瓶颈。 UGr7,+N&
w O/l|\n 怎么办?花钱继续买服务器和软件啊! "S)4Cjk j s7J#b7 这话听上去没错。但是有两个小问题: /1Rm^s)2z lty`7(\ 一个问题是太贵。 y]
M/oH 那时候小型机价格大概是从几十万到百万人民币;商业数据库软件费用差不多几千万,外加一大笔维护费。王坚 08 年刚来阿里时就给马云算了算,按照这样的速度“剁手”,光是买机器和软件就足够让阿里破产。阿里得找到一种成本更低的技术架构。 ^K&&O{ 另一个问题是不好用。 N.B
D]_
C 阿里在08-09年的时候,业务增长速度实在太快。每年都是十几二十倍,IOE 虽然都是美国公司,但事实证明美国的月亮也不会更圆。它们的系统并没有经受过服务几亿人这么大规模的考验,此时已经变得非常难用了。 2008 年中旬,马云召开了内部会议。事情已经刻不容缓,要研发一套新的技术架构来换掉阿里巴巴的旧引擎。 ZK_
IK)g >l'QX( 这个新的计算架构应该是什么样呢? 4z[Z3|_V ^vo^W: 首先,它要便宜。 USe"1(|E 6}{2W< 就像一日和三餐一样,无论去哪家餐厅,都不如自己做饭更实惠。长远来看,自己开发一套计算架构显然是最经济的。 Y@RPQPmIQ >^>
\y8on 其次,它要好用。 3]<$;[Q (zye
Ch 为了满足阿里巴巴庞大的计算任务,这套系统至少要比 IOE 表现更好,能同时调度数千台计算机,组成一个巨大无比的“大脑”。 .ay
K+6I >iWl-hI- 于是,“阿里云”这个词,第一次出现在公司高层的话语里。而王坚,加盟阿里巴巴之后的职务恰恰是“首席架构师”,他的使命就是从零开始建立这个云计算系统。 H9nZ%n sStaTR{ 0>Ecm# 王坚 AUxLch+"5K fm:/}7s 王坚是个理想主义者。 3}n=o d= }=7tGqfw 在他丰满的理想中,这个新架构的每一行代码都要自己来写。但现实骨感:环顾四周,他身边除了几位从微软带来的旧部,几乎一无所有。 *1}9
`$ ){R_o5 2008年10月,这个想象中属于中国的云计算系统被团队定名为“飞天”,源自中国神话中的形象。 c?b?x
6 2 -\AB!#fh 后来人们说,阿里云是技术驱动型的企业。不过在我看来,最初阿里云应该是起名驱动型的企业。名字倒是起得不错,但作为“三无”国家,底层科技起步较晚的中国在对美国的复杂计算机系统的战争中,几十年都未尝胜绩。 K'n^,
t [0F+
t,` 中国人研究的云计算,会“飞天”还是“坠毁”,旁人心里多多少少是有判断的,只是不便明说。
0qZ{:}`3 jcFh2 说回这个疯狂的计划。 7P:0XML} j[) i>Qw 飞天相当于一个发动机的,而时间紧迫,阿里巴巴准备同时做两件事:一边制造发动机,一边为自己的主力业务淘宝网顺便造一个整车出来。 QoI@/
jLj -twIF49 当时,淘宝网在计算力方面的主要需求就是“大规模数据计算”。所以,用飞天为淘宝造“大规模数据计算”制造整车的计划就被定名为“云梯计划”。 j:$2,?|5 }"Y]GH4Y 实际上,“云梯计划”关乎阿里的生死,不是儿戏。思来想去,公司内部还是做了两手准备: 5GT,:0 R7Hn8;.. 1)用一些已有的开源软件为基础,研发一个数据计算系统,这是“云梯1”计划。 ;STO!^9~ 2)而以“飞天”为基础,纯自研一套数据计算系统,被定为“云梯2”计划。 彼时绝没人想到,五年后的那个下午,这两座通向顶峰的云梯会用怎样的姿态占据画面的中心。千军万马雄列两旁,目睹荣耀的火焰和退潮的海水。 <k}>eGn N;RZIg(x 历史就这样以汹涌的姿态,向那些准备好的和没准备好的人敞开。 L{'qZ#N[ t`H^!
b &=t$
AIu 2009年 4$d|}aj
H GEIMCg(TRj 阿里云成立 &R pQ2*4n '-gk))u>) (2)招兵买马 mMu3B2nke= L=4?vs 满弓是阿里云的第六位工程师。 T(7
8{A> "uqa~R{ 招他进来的,是王坚在微软的旧部,阿里云的第一技术负责人林晨曦。面试结束时,林晨曦歪嘴一笑,提醒满弓:“你加入阿里云之后,要做好随时出差的准备。” 18
V*Cu kn`KU.J. 果然,满弓签完入职合同当天下午,就被“附赠”了一张火车票。他要去天津帮助招聘。 )v8;\1`s: fy9{W @E3p 满弓这样回忆十年前的那个下午: x\;`x$3t #j iQa" “阿里研发院” 2008年10月才成立,已经错过了招聘季的黄金时期。但是我们又确实太需要人才了,于是刻不容缓,要再扫荡一下那些大学,把“漏网之鱼”打捞回来。 xg\M9&J LDr!d1A
2009年 k`2 K?9\ M)Tv(7 阿里云的招聘海报 EmG`ga)s D-A#{e _ 跟着阿里云的招聘队伍,满弓跑遍了全国主要的几大城市十几个学校。每到一个学校,只呆三天。 tCtR(mG=A 8r)eiERv 第一天做宣讲,然后马上笔试;第二天统一面试;第三天发 Offer。 彼时的阿里巴巴已经很有名气了。很多错过招聘季的同学喜出望外,一时间各大学校风起云涌奔走相告齐来应聘,虽然从招聘者到应聘者,都没见过云计算长什么样子。 BalOph4M[ ?i)-K?4Sb 由于招聘人手实在太少,面对堆积如山的笔试试卷,满弓他们根本判不过来。焦头烂额的满弓擦汗时一回头,看到了同行的 HR 小姐姐。满弓两眼放光,二话不说把她们揪过来,一晚上就教会了她们如何判卷。 GAtK1%nPD IS]0 3_uQ u\&oiwSIP 当时判卷的场景 4D9lZa} $*8c0.{U 经过这样“连滚带爬”的招聘,到了2008年年底,阿里云凑够了了三十位工程师。 :h*20iP Af
^6 话分两头。 1H-R-NNJ: {Am\%v\ 下有林晨曦招兵买马,上有王坚每天“画饼”。 {Kd9}CDAZ 2P@>H_JFF 马云深受王坚鼓舞。虽然不懂技术,但是他逐渐发现,云计算这件事情的价值比一开始想象中的要大得多。 htlsU*x bHWy9 - 这是因为云计算系统会制造出一种具有极强弹性的计算力。这样的计算力一方面可以为阿里巴巴添置家当,另一方面还可以“批发零售”给无数中小企业,为未来世界建设了一整套“基础设施”。 这样来看,就把“独善其身的工具”变成了“兼济天下的生意”,这不正是马云创建阿里巴巴的基本信念吗? BAg*zYV7 / D#vs9S 从这一刻开始,马云就对阿里云寄予重望。只要有空,就到阿里云的团队里和林晨曦、满弓这些工程师们一起聊天讨论。 241YJ SU2(XP]5 (al7/EhY 马云、王坚 %!p14c*J H 9BNAj-Xa 和工程师们的合影 u#la+/
9%kY8#%SV 然而,事情发展到这里,就开始有些错位了。 -!(3fO: U|-4*l9Ed 阿里的很多的业务部门希望的是稳定地在现有系统上加以改进,最好别冒太大风险; aW4 tJN%! "`C|;\w 但飞天团队却黄巾高擎赤膊上阵左右开弓,想依靠一己之力,开发出一套改写世界历史,可以让中国人扬眉吐气的完美云计算系统。 #B)/d?aa' H,KU!1p 刚才我说阿里云是“起名驱动型的公司”,你看看这帮疯子给飞天内部模块的命名,就知道他们心里在想什么了: A{mbL2AxwC i
LK8Wnrq 分布式存储的系统,就像大地一样承载万物,那就叫“盘古”。 = J).(E89 调度系统,需要“能掐会算”,就用懂得阴阳八卦的“伏羲”命名。 N, ;'oL+ 结构化存储系统,就用会盖房子的“有巢”。 J0mY=vX 网络通信,就用追日的“夸父”。 "p2 $R*ie 等等。 飞天团队一片斗志昂扬。 2,q^O3F k$k(g 其他部门的很多领导层,用半信半疑外加慈爱的眼光看着他们。 +*!oZKm. )0fQ(3oOg RZm5[n (3)淘宝的一场战争 f(?>z!n0 =@gH$Q_1 时间不等人,转眼到了2009年。 dSk\J[
D p^ 9QYR 在隔壁淘宝网的普通员工中,有人在“隔江犹唱后庭花”,有人却已经感到“山雨欲来风满楼”。 .'5yFBS :]=Y1*L\)
2009年,小邪刚刚加入阿里一年,在淘宝网参与系统研发。当时他和同事都感觉到,淘宝网面临的矛盾非常明显: o9q%=/@, ^X"G~#v=q 业务并不赚钱,09年只有一个季度勉强盈利。而赚来的这点钱,眼看都要填进去购买服务器和软件产品,入不敷出。 小邪记得很清楚,他昨天刚听说隔壁阿里云准备搞云计算,今天就迎来了一个“特殊的客人”。 W q F( g4RkkoZ>) 林晨曦走到淘宝网技术团队面前,搬个板凳兀自坐下:“你们淘宝的大数据系统用我们的阿里云架构吧。” eey <:n/Z S)@R4{=e"V “代码已经写了多少?”小邪问。 ?ti7iBz? +7N6]pK|" “几行吧。”林晨曦说。 5j{o0&=_$ \QHe 0?6 事情就这样定下来了。 !+9H=u 06 K8|K 云梯1、云梯2,两套系统一边搭建,一边在淘宝内部实验,一边承担部分计算任务以缓解现有系统不足的压力。 0f;L!.eP
)'DFDrY 当时淘宝技术保障数据库管理员的负责人是后羿。他几次欲言又止,还是硬着头皮在内部会议上宣布了这个消息:淘宝要放弃 Oracle,转投自研的数据库架构了。 ' OdZ[AN 3,3{wGvHHW 结果,八十多个 Oracle 工程师把他堵在会议室里。“你再说一句试试?” RyIr_:&-~ CHN!o9f 他们的愤怒完全合情合理。“如果上边铁了心要干,兄弟们的前途在哪里?” & |