探索中国CIO人才现状 | 第四季调研报告
百度数据中心引爆变革 软硬件同时遭威胁
2013-06-14  作者:企业网 

  今天,我们会发现,整个计算的重心正在从桌面系统转向数据中心。这样的转变意味着什么?它又会连带引发什么样的变革?在第五届中国云计算大会上,百度大数据首席架构师林仕鼎作了题为《应用驱动的数据中心计算》的精彩演讲,为我们揭开了答案。


  “30年PC时代已终结。新时代,是一个以数据中心计算为特征的时代,整个数据中心就是一台计算机。”林仕鼎的深刻认识燃起了听众的热情。


  也正因为如此,在林仕鼎看来,计算范式发生了变化,系统所面临的环境与设计目标、设计理念亦产生了变革。


  计算范式之变


  据林仕鼎介绍,在桌面系统中,由底层到上层可分为Architecture(架构)、BIOS、Kernel(核心如linux)和Applications(应用),而在数据中心计算中,相应地变为了Fabric(体系结构)、Host(主宿操作系统)OS、Infrastructure(大规模分布式基础架构),以及Services/Taskss(服务/任务)。


  计算范式的变化带来了两大观念上的改变:从单机计算追求0Bug,转变到对错误有一定容忍度;从追求完全的正确性,转变到追求精确度,如90%。


  “在单机设计理念中,因为只有一台机器,坏了就没了,系统一定是越可靠越好。所以,在设计时,要在系统里面加很多冗余信息和校验逻辑,这样在出现错误后还可恢复。”林仕鼎表示,“而在数据中心计算中,主要是分布式系统,可同时调度非常多的设备,所以它能够容忍任意一台设备出现问题。这使得两者在系统设计上拥有很多差异。”


  而从追求正确性到追求精确度,与大数据的思想——从追求因果性转变为追求相关性——一脉相承。这也使得现在很多服务不依靠人工制定的规则,而依靠概率模型来得出相关结果。


  环境与设计目标之变


  由于整个计算重心发生转移,计算所面临的环境和系统设计目标也必然需要发生改变。“在单机计算环境中,主要的应用场景是单用户多任务,而在数据中心计算中,则是多用户单任务。”林仕鼎表示,这种变化使得系统设计思路亦发生改变,如需要更多地考虑并行性问题。


  百度自主研发的SSD就是一个很好的例子。在传统的SSD架构中,是由一个总的SSD控制器来控制下面的Flash存储单元,这样的优势是黑箱化、层次化,不利之处是SSD往往读取较快,写入较慢,容易形成瓶颈。而百度根据应用需求,取消了SSD架构中的写缓冲、擦写平衡等复杂逻辑,大幅简化SSD控制器的设计。通过将一个大的SSD划分为N个单元,每个单元都有独立的控制器和存储单元,这些信息和控制接口暴露给上层存储系统后,形成了多个管道,并行读取、存储效率可以大幅提升。


  此外,林仕鼎还表示,除了应用场景不同外,对规模、成本、交互时间的要求也在发生变化。


  设计理念之变


  “从单机计算到数据中心计算,还推动了设计理念的变革。”林仕鼎表示,理念上的变革包括,系统透明性不再成为美德,层次化开始向竖井式演进,软硬件系统向应用驱动和软件定义的方式发展。例如,百度在设计硬盘系统时,去除RAID,暴露裸盘等都是这些理念转变的重要体现。


  林仕鼎最后还在会上分享了云时代的硬件设计原则——简化和硬件可编程。在简化方面需做的有:剥离控制逻辑,尽可能在更大的范围共享一切部件、逻辑,要更关注可控性。在硬件可编程方面需做的有:暴露一切接口,尽可能收集数据。