微信号:huangliang_storage

介绍:企业存储、服务器、灾备等领域技术分享,交流 @唐僧_huangliang (新浪微博 )

Xeon SP服务器新技术:防代码入侵从BIOS做起

2017-06-23 00:08 唐僧
本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博ID:唐僧_huangliang,以便更好地与读者互动。


服务器固件保护,在BMC还是芯片组上实现更好?

 

由于新一代Xeon Processor ScalableXeon SP)平台将于711日正式发布,服务器厂商有些功能特性提前“偷跑”。比如我写过《新一代服务器预览:M.2SSD系统盘RAID1方案》,最近还看到某厂商就宣传“推出了世界上最安全的工业标准服务器... 将安全性直接搭载在xxx(这里指BMC,我过滤了一个关键词)芯片上,在由硅制作的芯片上创建了一个不可更改的指纹,若指纹不匹配,服务器固件就不会启动。

 

其实从技术上看,我觉得他们说的这个还有更简单通用的办法可以实现。

 

上图随便找个例子,Nuvoton品牌源自华邦电子,与ASPEED等同为流行的底板管理芯片品牌之一。

 

这是我几年前拍摄的某服务器主板上的BMC管理芯片,对于该部件服务器厂商有几种选择:使用通用型号BMC、自主设计?或者部分定制

 

我在前面说“最安全”那家,就是宣称使用的自主BMC。其实这东西就像RAID卡,术业有专攻,自主设计未见得比芯片厂商通用方案的功能强。而且我觉得所谓自主与部分定制,可能只是依赖第三方程度上的差别。本文想谈谈不同服务器厂商的设计,芯片的不同真的会影响安全性吗?

 

Intel Boot Guard:在芯片组上的保护

 

Intel Boot Guard流程图,引用自Dell PowerEdge Product Group资料《CYBER-RESILIENCY STARTS AT THE CHIPSET AND BIOS》,文章结尾会列出下载链接。

 

这张图看起来可能有点不太好懂,我来给大家用文字解释下。

 

Dell14PowerEdge服务器支持Intel BootGuard验证启动特性。该启动卫士扩展平台可信根(platform root of trust)到PCH芯片组。PCH包含一次性可编程“保险丝”,由Dell工厂在制造过程中烧录选定的Boot Guard策略和主公钥Master PubicKey)的hash

 

BIOS SPI flash(闪存)上的密钥清单由这个Dell主公钥签名,并委托授权到启动策略清单密钥。然后该启动策略清单授权初始化启动块(IBB)——复位后执行的第一段BIOS代码模块。如果IBB认证失败,Boot Guard将关闭系统并不允许启动。每个BIOS模块包含该启动链中下一个模块的hash值,并用它来验证下一个模块

 

IBB验证(SEC+PEI)在交接控制权之前。(SEC+PEI)接下来验证(PEI+MRC)和(PEI+MRC)进一步验证(DXE+BDS)模块。在这一点之后,如果打开了UEFI安全启动,可以扩展可信根来保持处理BIOS、第三方UEFI驱动和OS loader

 

点评:以上描述给我的感觉就是,在BIOS启动全程避免执行被破坏的代码,以防止在这个阶段被注入后门等安全隐患。所以,不仅BMC芯片上支持“创建不可更改的指纹”,IntelPCH芯片组已经集成该功能了,尽管我现在还不确认有多少服务器厂商对此提供支持。

 

BIOS冗余恢复选项

 

不知有多少朋友经历过1998年的CIH病毒,那时候我恰好在中关村,帮同学配的一台电脑没几天BIOS就被破坏无法开机了,当然还有编程器或者土办法热插拔来恢复。虽然CIH在当年产生的破坏远比前不久的比特币勒索病毒要大,但其作者只是因为恶作剧想破坏数据(C盘以外的不难恢复)而并没想到以此牟利。

 

扩展阅读《有了备份,就不怕勒索病毒吗?

              勒索病毒预防实战:有的PC打不上补丁怎办?

 

上图中有一个BIOS经过iDRACBMC)和PCH映射的过程。

 

前面说的Intel Boot Guard是防止未经验证的BIOS代码执行,而这里的冗余恢复选项则是在面对黑客破坏或者升级BIOS时断电而无法启动的情况。

 

每台PowerEdge 14G服务器上有2BIOS SPI ROM,一个主ROM,另一个为恢复ROM,后者在正常启动时处于离线。当主ROM受损时BIOS恢复进程会自动触发系统复位

 

具体的恢复过程我就不在这里赘述了,在CIH病毒之后的那几年,可能有朋友还记得技嘉等厂商推出过双BIOS PC主板,也是同类的功能。当然服务器的实现要复杂些,需严格确保过程的安全可靠,不像当年DIY主板上有时莫名奇妙地从第二颗BIOS启动执行恢复了。

 

就写这么多吧,我只是想让大家了解技术的另一种实现方式,心里有数就能防忽悠:)

 

参考资料

http://en.community.dell.com/techcenter/extras/m/white_papers/20444061


:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术可以加我的QQ/微信:490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:huangliang_storage


长按二维码可直接识别关注

历史文章汇总(传送门):http://chuansong.me/account/huangliang_storage

点击下方“阅读原文”,查看更多历史文章
↓↓↓
 
企业存储技术 更多文章 AMD EPYC官方资料乌龙?谈服务器CPU互连效率 Dell EMC透露NVMe战略,为什么阵列还要等半年? 有了备份,就不怕勒索病毒吗? NVMeF的另一种用法:连接AFA控制器和JBOF Intel Optane P4800X评测(3):Windows绑核优化篇
猜您喜欢 CODING 技术小馆 · 广州 · Docker 应用与实践 FEX 技术周刊 - 2017\/04\/05 【封面故事】《C程序设计新思维》中的斑袋貂 PADANS COMPARISON WITH SQL 系列 ——SELECT&WHERE 若问今天何为贵,当属MPD门票最难求!凭感情,送你……