-
UID:12641
-
- 注册时间2013-11-16
- 最后登录2023-11-02
- 在线时间364小时
- 配偶单身
-
-
- 发帖682
- 搜Ta的帖子
- 精华0
- 铜币48325
- 威望621
- 贡献值20
- 银元28073
-
访问TA的空间加好友用道具
- 发帖
- 682
- 铜币
- 48325
- 威望
- 621
- 贡献值
- 20
- 银元
- 28073
|
阿里云 8I.VJ3Q
#K4*6LI 世事安稳,岁月静好。 ~8{sA5y 2.nE
k 电影里才有疯子。麦克墨菲在疯人院里带领一群精神病人揭竿而起,怼天怼地;饿了三天的黑皮为了抢一口面包被店主追上高架桥,末路狂奔;杰克和泰勒在午夜的搏击俱乐部里挥拳相向,鲜血淋漓。屏幕对面,我们把爆米花塞进嘴里,哭成狗或者笑成狗。电影散场,各自回家。 "(f
`U. 8{
gXToK 真正的疯子,从来不看电影。 $gvr
-~ e;h,V( 他们把别人的目光变成聚光灯,把自己的生活变成真人秀,手提钢刀用肉身串演一个浓重的角色。他们的人生结局无外乎两种:黄袍加身,或者玉石俱焚。 -ihiG_f nQ-mmY># 阿里云这群疯子,就用56度的荷尔蒙,在横跨十年的悠长画布上涂抹了这样一个故事。 :$%>4+l N=~~EtX )R &,'`\ (1)一个大问题 `*_CElpP" TH:W#Ot 2008年9月,王坚加入阿里巴巴。 <#*.}w~
3{ "O,h 马云把他从微软亚洲研究院常务副院长的位置挖来,是因为阿里巴巴面临一个重大的危机——公司的“脑力”快不够用了。 wd+K`I/v7h Ryv_1gR! 阿里巴巴的“脑力”,其实就是“计算力”。 0` 5e u-:Ic.ZV 几亿用户无论是在淘宝剁手,还是支付宝上转账,这一切都要靠巨大的计算力来思考、记忆。 Ilq=wPD}j 恰恰和人一样: `
>U?v 如果这个“大脑”记忆被填满,就没办法储存新的商品和交易记录。 2 hq\n< 如果这个“大脑”思维速度跟不上,就没有办法让用户及时下单、付款。 2008年,中国虽然已经加入 WTO,还把国际友人请来热热闹闹地开了一次奥运会,但在科技领域仍然是个标准的“三无”国家:没有自己的操作系统,没有自己的芯片,同样没有自己的计算力系统。所以,购买国外成熟的设备和系统,几乎是 BAT 和所有大国企的唯一选择。 RB$
z]/= >{nH v) 国外的东西,无外乎“IOE”这三样标配: vFhz!P~ q7_+}"i I(IBM,服务器提供商,他们提供的服务器俗称“小型机”) v0LGdX)/Y O(Oracle,数据库提供商,他们的软件是著名的“甲骨文商业数据库”) 5JSrrpGr E(EMC,存储设备提供商,他们提供的是“集中式存储”)。 鲜有人知,那时的阿里像依赖氧气一样依赖 IOE。 ?JXa~.dA G3a7`CD 一个支付宝的同事给了我翻出了当年的数据:2008年,在阿里的IT架构中,淘宝和支付宝使用的绝大部分都是 IBM 小型机、Oracle 商业数据库以及 EMC 集中式存储。 :FHA]oec1 g)1X&> 当年用户激增,数据越来越多,每天早上八点到九点半之间,服务器的处理器使用率都会飙升到 98%。离爆棚就差两个百分点。 :kG)sw7 PVYyE3`UB 阿里巴巴就像赛道上的跑车:速度飞快,但引擎已经发红,再踩几脚油估计就要冒烟,后果不堪设想。 #
yN*',I& !%[S49s 可能连马云自己都没有想到,阻碍阿里巴巴增长最迫切的阻力不是商场上的博弈、不是政策的变化,而居然是 IT 基础设施的瓶颈。 pW|u P8# tTuX\;G 怎么办?花钱继续买服务器和软件啊! i=rH7k bK*~ol 这话听上去没错。但是有两个小问题: [Y/:@t"2y BJy;-(JP 一个问题是太贵。 T1bd:mC}n 那时候小型机价格大概是从几十万到百万人民币;商业数据库软件费用差不多几千万,外加一大笔维护费。王坚 08 年刚来阿里时就给马云算了算,按照这样的速度“剁手”,光是买机器和软件就足够让阿里破产。阿里得找到一种成本更低的技术架构。
3+U]?7t 另一个问题是不好用。 g
7n" 阿里在08-09年的时候,业务增长速度实在太快。每年都是十几二十倍,IOE 虽然都是美国公司,但事实证明美国的月亮也不会更圆。它们的系统并没有经受过服务几亿人这么大规模的考验,此时已经变得非常难用了。 2008 年中旬,马云召开了内部会议。事情已经刻不容缓,要研发一套新的技术架构来换掉阿里巴巴的旧引擎。 #{PmNx%M eV2mMSY 这个新的计算架构应该是什么样呢? E!mmLVa9 6R4<J%$P 首先,它要便宜。 .zkP~xQ~ v&;:^jJ8 就像一日和三餐一样,无论去哪家餐厅,都不如自己做饭更实惠。长远来看,自己开发一套计算架构显然是最经济的。 <[i}n55 U(,.D}PG 其次,它要好用。 (MLhaux- ;;#`#v 为了满足阿里巴巴庞大的计算任务,这套系统至少要比 IOE 表现更好,能同时调度数千台计算机,组成一个巨大无比的“大脑”。 s&Yi 6:J `hUHel;6 于是,“阿里云”这个词,第一次出现在公司高层的话语里。而王坚,加盟阿里巴巴之后的职务恰恰是“首席架构师”,他的使命就是从零开始建立这个云计算系统。 z 7T0u.4Ss v("wKHWTI@ r\qz5G *6 王坚 6N" l{! DNP@A4~ 王坚是个理想主义者。 m4m<nnM 27#5y_
` 在他丰满的理想中,这个新架构的每一行代码都要自己来写。但现实骨感:环顾四周,他身边除了几位从微软带来的旧部,几乎一无所有。 Apfnx7Fv `^6 ,kI-c 2008年10月,这个想象中属于中国的云计算系统被团队定名为“飞天”,源自中国神话中的形象。 K{=PQ XSU MbA\pG'T 后来人们说,阿里云是技术驱动型的企业。不过在我看来,最初阿里云应该是起名驱动型的企业。名字倒是起得不错,但作为“三无”国家,底层科技起步较晚的中国在对美国的复杂计算机系统的战争中,几十年都未尝胜绩。 75NRCXh. (
kw5>c7 中国人研究的云计算,会“飞天”还是“坠毁”,旁人心里多多少少是有判断的,只是不便明说。 PJ\0JR7a [Qj;/ 说回这个疯狂的计划。 |He=LQ}0 J2M(1g)t9 飞天相当于一个发动机的,而时间紧迫,阿里巴巴准备同时做两件事:一边制造发动机,一边为自己的主力业务淘宝网顺便造一个整车出来。
$NG++N T?wzwGp-[ 当时,淘宝网在计算力方面的主要需求就是“大规模数据计算”。所以,用飞天为淘宝造“大规模数据计算”制造整车的计划就被定名为“云梯计划”。 Hj6'pJ4 Z :nbZHByh 实际上,“云梯计划”关乎阿里的生死,不是儿戏。思来想去,公司内部还是做了两手准备: <+tD z ( Jp~zX
lu 1)用一些已有的开源软件为基础,研发一个数据计算系统,这是“云梯1”计划。 X.V[0$.; 2)而以“飞天”为基础,纯自研一套数据计算系统,被定为“云梯2”计划。 彼时绝没人想到,五年后的那个下午,这两座通向顶峰的云梯会用怎样的姿态占据画面的中心。千军万马雄列两旁,目睹荣耀的火焰和退潮的海水。 w/m:{c Hk $kPHxD!" 历史就这样以汹涌的姿态,向那些准备好的和没准备好的人敞开。 a9Y5 @_yoX(.E& ,hRN\Kt)p 2009年 7o]HQ[ xO 1[PMDS_X 阿里云成立 1cC1*c0Z 'jfRt-_- (2)招兵买马 z&}-8JykH !mnUdR|>( 满弓是阿里云的第六位工程师。 ^%<pJMgdF DBgMC"_ 招他进来的,是王坚在微软的旧部,阿里云的第一技术负责人林晨曦。面试结束时,林晨曦歪嘴一笑,提醒满弓:“你加入阿里云之后,要做好随时出差的准备。” {C3Y7< (K<9hL+X 果然,满弓签完入职合同当天下午,就被“附赠”了一张火车票。他要去天津帮助招聘。 T@YGB]*Y
uY#TEjGh] 满弓这样回忆十年前的那个下午: 8dO?K*J,H' i.y)mcB4 “阿里研发院” 2008年10月才成立,已经错过了招聘季的黄金时期。但是我们又确实太需要人才了,于是刻不容缓,要再扫荡一下那些大学,把“漏网之鱼”打捞回来。 qoX@@xr1 ;['
a
2009年 3z8C <02m%rhuW 阿里云的招聘海报 ,o#kRWRG JAjku6 跟着阿里云的招聘队伍,满弓跑遍了全国主要的几大城市十几个学校。每到一个学校,只呆三天。 ]
d?x$> 8%:]W^ 第一天做宣讲,然后马上笔试;第二天统一面试;第三天发 Offer。 彼时的阿里巴巴已经很有名气了。很多错过招聘季的同学喜出望外,一时间各大学校风起云涌奔走相告齐来应聘,虽然从招聘者到应聘者,都没见过云计算长什么样子。 E>uVofhml 9pD
7 f` 由于招聘人手实在太少,面对堆积如山的笔试试卷,满弓他们根本判不过来。焦头烂额的满弓擦汗时一回头,看到了同行的 HR 小姐姐。满弓两眼放光,二话不说把她们揪过来,一晚上就教会了她们如何判卷。 .\:J~( Q[u6|jRt 4N>>+]MWc 当时判卷的场景 \'v(Xp6
F-
r
Q3 经过这样“连滚带爬”的招聘,到了2008年年底,阿里云凑够了了三十位工程师。 BmBz}:xMez {/8Q)2*>0 话分两头。 Ng=ONh
E"PcrWB& 下有林晨曦招兵买马,上有王坚每天“画饼”。 I'!/[\_
9A$m$ 马云深受王坚鼓舞。虽然不懂技术,但是他逐渐发现,云计算这件事情的价值比一开始想象中的要大得多。 nJFg^s1 k%81f'H 这是因为云计算系统会制造出一种具有极强弹性的计算力。这样的计算力一方面可以为阿里巴巴添置家当,另一方面还可以“批发零售”给无数中小企业,为未来世界建设了一整套“基础设施”。 这样来看,就把“独善其身的工具”变成了“兼济天下的生意”,这不正是马云创建阿里巴巴的基本信念吗? |ys0`Vb=$ QlZ@ To 从这一刻开始,马云就对阿里云寄予重望。只要有空,就到阿里云的团队里和林晨曦、满弓这些工程师们一起聊天讨论。 (6gK4__}] u{e-G&]^; {D`T0qPT[ 马云、王坚 /X*oS&-M o
l ({AYB 和工程师们的合影 G|
m4m. =Lp7{09u 然而,事情发展到这里,就开始有些错位了。 zI;0& ~)]} 91p 阿里的很多的业务部门希望的是稳定地在现有系统上加以改进,最好别冒太大风险; ccJM>9 4P8*k[. 但飞天团队却黄巾高擎赤膊上阵左右开弓,想依靠一己之力,开发出一套改写世界历史,可以让中国人扬眉吐气的完美云计算系统。 q1{H~VSn" &^.57] 刚才我说阿里云是“起名驱动型的公司”,你看看这帮疯子给飞天内部模块的命名,就知道他们心里在想什么了: l*=aMjd? nk=$B(h 分布式存储的系统,就像大地一样承载万物,那就叫“盘古”。 X[3}?,aqL 调度系统,需要“能掐会算”,就用懂得阴阳八卦的“伏羲”命名。 Ip
*g' 结构化存储系统,就用会盖房子的“有巢”。 U5r}6D!) 网络通信,就用追日的“夸父”。 cj$6 等等。 飞天团队一片斗志昂扬。 ;;U:Jtn2 pdVQ*=c?M 其他部门的很多领导层,用半信半疑外加慈爱的眼光看着他们。 1KE:[YQ1 b[ w;i]2 qUJ
aeQ (3)淘宝的一场战争 Ey`h1Y q_ fam,9 时间不等人,转眼到了2009年。 E-2eOT -ysn&d\rV 在隔壁淘宝网的普通员工中,有人在“隔江犹唱后庭花”,有人却已经感到“山雨欲来风满楼”。 +[-i%b3q A%bCMP 2009年,小邪刚刚加入阿里一年,在淘宝网参与系统研发。当时他和同事都感觉到,淘宝网面临的矛盾非常明显: ROb\Rxm , H
kj1x 业务并不赚钱,09年只有一个季度勉强盈利。而赚来的这点钱,眼看都要填进去购买服务器和软件产品,入不敷出。 小邪记得很清楚,他昨天刚听说隔壁阿里云准备搞云计算,今天就迎来了一个“特殊的客人”。 2N [= kLP0{A
林晨曦走到淘宝网技术团队面前,搬个板凳兀自坐下:“你们淘宝的大数据系统用我们的阿里云架构吧。” ]0j9>s2|Z b/("Y.r= “代码已经写了多少?”小邪问。 X$n(-65 [k%4eO2p " “几行吧。”林晨曦说。 $'wq1u 7/IlL 事情就这样定下来了。 i@P
}{
``K#}3 云梯1、云梯2,两套系统一边搭建,一边在淘宝内部实验,一边承担部分计算任务以缓解现有系统不足的压力。 @%ECj)u`O W;_E 4 当时淘宝技术保障数据库管理员的负责人是后羿。他几次欲言又止,还是硬着头皮在内部会议上宣布了这个消息:淘宝要放弃 Oracle,转投自研的数据库架构了。 l.=p8-/$'7 g=8un`]7 结果,八十多个 Oracle 工程师把他堵在会议室里。“你再说一句试试?” gFN9jM uaPx" 他们的愤怒完全合情合理。“如果上边铁了心要干,兄弟们的前途在哪里?” <i. apBH `ldz`yu6++ 最终,一场恶斗转化成了几十个工程师坐在会议室促膝谈心。技术人是讲理的:淘宝已经这么大了,如果现在不刮骨疗毒,自己砸自己的饭碗,将来整个淘宝都会命悬一线,到时候大家还不是沦落天涯。想通了这些,工程师们也冷静多了。 P:xT0g
tt V"KS[>>f 这八十多个工程师里,包括后来的阿里技术保障部负责人振飞。振飞站出来说:“好,让我们学新技术可以,但是咱们拿事实说话。你后羿敢不敢跟我打个赌?以三年为限,用新技术的淘宝核心交易系统必须达到零故障!” 2DDsWJ; PAF8Wlg 后羿咬咬牙,敢! *%FA:Y
}
p:%[ 但后羿一个人的分量还远远不够重。毕竟淘宝上有这么多业务,这么多买家,这么多卖家,万一数据迁移失败,谁来负责?时任淘宝技术总架构师行癫(现任阿里巴巴 CTO)见状,把心一横,宣布自己和部门也愿意站出来,共同承担技术风险:“干好了我们大家荣誉等身,干坏了要杀要剐我来扛!” gE7L L=x SZ
U
\i* 看到行癫都赌上了自己的身家性命,也就没人再说什么了。 (P|pRVO V-yUJ#f8[ 2009年秋天,轰轰烈烈的 IT 架构升级项目在淘宝网正式启动。一群 Oracle 工程师,就这样含着泪,一点一点亲手拆毁自己安身立命的系统。 nHXX\i t+ Bf#: Ri7((x]H" (4)荒野求生 t67Cv/r~ Xl-e ! 林晨曦用来“忽悠”淘宝网的“几行代码”,是在北京写出来的。 ['qnn| :$r ^_ 2009年春节上班第一天,在北京上地的汇众大厦203这间连暖气都没有的办公室里,一帮工程师一边口呼白气,一边敲出了“飞天”的第一行代码。 @C8DZ5) _2ef LjXQ 0Q9T3X 飞天的第一行代码 X[$++p
. 2t#L:vY 说起来,这个地方算是阿里云最早的办公室,但是门口也没个牌子。直到半年后他们搬出大厦,保安都不知道这帮神神叨叨的人究竟是干什么的。(不过十年后的今天,他们的手机里的很多 App 也许都跑在阿里云的服务上。) 6;b9swmh eVh-_ 每天,工程师们除了噼里啪啦写代码,还得顺便“荒岛求生”——自己订水、买垃圾桶、修桌椅板凳、修无线网,连茶叶和咖啡都是从自己家带来的。 %VNlXHO. ssQ BSbx 不过,他们坚信自己在做的事情还是挺伟大的。“没准将来我们成功了,我们写的飞天第一行代码还能印在T恤上呢!”角落里有人瑟瑟发抖地说。 bZw
naM4"F ",qU,0 那个时候的他们,看上去和一帮戴着眼镜的教徒无异。 3251Vq % z? ]G3$i( 时间马上又到了夏天。北京的夏天,你懂的。当时测试系统的服务器就架在办公室里,这就是个巨大的火炉。大厦的空调不行,还没到七月份,程序员就热得撑不住了。为了降温,每天上午他们都叫冰场送两大块冰来。 f>$``.O ro~+j}* 有一次周六,马云来北京,专门到阿里云的办公室去看看。林晨曦赶紧想打开电脑给马老师展示一下自己团队的成果。结果按了半天开关,机器都没反应。他才发现大厦停电。。。马云就这样坐在办公室等了半个小时,直到物业恢复供电才一睹阿里云飞天系统最初的芳容。 2@j";+ _.)eL3OF 王坚跟马云说,这帮人很能干,每天晚上都加班。马云惊了,在这种地方还能加班??没过几天,阿里云就搬出了这幢大楼,进入了有空调的办公室。 @z`@f"l Jf;?XP]z -7qIToO. 同事们往办公室里运冰 R
W/z1 dFXc/VH') (5)神坑,阿里云 v
$({C }:Z9Vc ZP` 金融大咖胡晓明,2005 年加入阿里,以办事雷厉风行闻名全集团。 9WG{p[ >]D4Q<TY 2009年6月,马云找到胡晓明,准备交给他一个大任:内部创业,做阿里金融的总裁。 9)dfL?x8V{ T]9\VW4 胡晓明信心满怀,准备撸起袖子说干就干。不料,马老师悠悠地说,不要急,你要先答应我两件事。 UK[v6".^h ib6^x:HGU 马云:第一件事,你只能做100万人民币以下的贷款生意,帮助像当年的我一样借不到钱的创业者。 6QQfQ, ?\=/$Gt 胡晓明:理解,这没问题。 2'0K WYM u{H?4|'( 马云:第二件事,你必须跟刚成立的阿里云绑在一起,用他们的技术架构支撑你的服务。 J>vMo@ SI:ifR&T
胡晓明:纳尼??!! *?p|F&J |UnUG
这两件事,胡晓明最终都答应了。不过阿里云这帮看上去疯疯癫癫的人,他们技术到底靠不靠谱,胡晓明可是真没底。 & |