第149章 阿里云(2 / 4)

林渊笑了笑,脸不红心不跳地把忽悠马杰克的那套说辞又搬了出来:“王院士,我不是说过吗?我是个天才,天才的脑回路,天生就跟普通人不一样。”

听到这句回答,王坚不仅没生气,反而被逗乐了。

“现在的年轻人,有点意思。”王坚拉开椅子坐下:“光靠嘴说是没用的。既然你说你能解决我们数千台计算机并发架构的死锁问题,那你先说说看,你理解的原理是什么?”

林渊收起笑容,直接切入正题。

“王院士,阿里的飞天系统,底层的分布式调度模块叫伏羲,对吧?”

林渊拿起桌上的白板笔,在白板上画了一个最简单的结构图,“伏羲采用的是典型的master-slave(主从)架构。你们现在的目标,是想把5000台服务器连成一台超级计算机。但你们卡壳了。”

王坚脸上的笑意逐渐收敛,神色变得极其凝重。

林渊继续在白板上敲击:“卡壳的原因,是因为你们在用传统的网络思维做超算集群。当5000台计算节点同时向主控中心发送心跳包和资源汇报时,海量的rpc(远程过程调用)通信瞬间就会引发广播风暴。”

为了让人听得更直观,林渊切换到了大白话:“这就好比,一个大教室里有5000个学生,下课铃一响,5000个人同时冲上讲台,争着抢着把手里的作业本往这一个老师的脸上砸。”

“这老师就算长了八头六臂,也会被瞬间压死。在系统里的表现,就是主节点cpu瞬间跑满,网络带宽堵死,系统彻底崩溃。”

王坚死死盯着白板上的那个架构图,神情开始变得郑重,这个年轻人不简单。

当然军分技术也就在现在不简单之后通过不断的迭代更新,在林渊的那个年代属于是基操勿六,人手必备,你不会都找不到工作。

而现在林渊所说的问题,正是阿里云现在遇到的困难和瓶颈。

“那你的解决思路是什么?”王坚的语气中少了几分怀疑。

“剥离分布式路由,做极度集中的网络收敛。”

林渊给出了极其精准的技术方向,“不能让5000个学生直接找老师。我们要构建一个极其强悍的集中式单点sdn网关。把底层的复杂路由逻辑全部切断,让这5000台机器只认这一个中央交通枢纽。”

举报本章错误( 无需登录 )