1、互聯網公司應該選擇什么樣的IaaS基礎架構ZStack CEO張鑫為什么需要IaaS超大規模數據中心的難題穩定壓倒一切全API化是剛需混合云是未來2 3 4 51為什么需要IaaS一切為了業務早期互聯網公司都是業務驅動,不是技術驅動傳統架構是業務上線的最快方式CloudNative門檻很高,不要追求的太早Architecture Reset是硅谷互聯網公司都繞不開的坎避免煙囪式架構直接使用物理機沒什么不對,但資源池化是橫向擴展的基礎靈活性是IaaS相對于物理機最大的優勢建大一統的平臺目的是為了以標準化的方式統一運維基礎設施IaaS的出現為基礎設施層提供了統一的標準容器 VS IaaS使用容器的
2、目的是實現應用的CloudNative容器IaaS化并非不行,但難度巨大存儲怎么辦?網絡怎么辦?新技術怎么辦?例如SD-WAN業務要一定要分層,讓上帝的歸上帝,凱撒的歸凱撒沒有經驗的過早容器化容易掉到坑里選擇簡單的IaaS互聯網公司的核心是業務,不是IaaS以最小的投入驗證基礎架構模型保證大規模部署后的易用性餓了么CTO張雪峰:“當初選型時,我們比較了市面上大部分解決方案,發現有的功能缺失,有的方案極其復雜、整體ROI不高,ZStack則不同,我們只投入了一個人的研發力量,就把這套系統成功建了起來?!背笠幠祿行牡碾y題多少設備算多?10萬臺物理機、百萬級虛擬機的管理目標設備數目增加影響Ia
3、aS部署規模,運維難度指數上升關鍵難度在于處理數萬并發API餓了么高級運維總監徐?。骸梆I了么單個集群就管理超過1800臺物理機”滴滴基礎平臺架構部負責人沈金緹:“目前在500臺左右。滴滴只選擇了ZStack一個平臺做IaaS管控系統,未來的集群規模有可能超過一萬臺物理機”找鋼網運維總監彭海平:“目前ZStack在找鋼網管理了超過5000臺虛擬機,到年底這個規模會超過10000臺虛擬機”全異步是解決問題的唯一方法一致性哈希與無鎖架構穩定是壓倒一切的剛需基礎架構穩定性決定業務穩定性數據面管控面緊耦合是IaaS不穩定的根源運維復雜引入的人為因素是不穩定的誘因IaaS穩定的兩個基本要求:易于災難重建
4、斷電能夠自舉餓了么:“ZStack管理平臺和生產環境完全解耦式的設計,就算ZStack平臺都掛了,線上的服務也不會受任何影響(新部署虛擬機除外),而且只要數據庫在,幾分鐘就能恢復并重新搭一套系統。生產系統上線一年半,至今未發生過任何事故”Hotfix是運維的地獄,無縫升級才是解決問題的根本IS全API化是剛需全自動化是終極追求僅僅提供虛擬化資源管控API是不夠的從資源上架到應用部署應該形成無人工感覺的自動化流程IaaS平臺應該提供跟PaaS平臺解耦的能力混合云是未來任何IT都繞不開公有云公有云的創新速度更快,可以通過混合云架構利用這些創新私有云跟公有云無縫融合是趨勢當前混合云有兩大場景可以切入
5、互連場景VM-110.200.251.62VM-2192.168.88.82Vrouter10.255.255.22010.200.0.0/16192.168.0.0/16阿里云 華東2 VPC高速通道邊界路由器自定義路由1邊界路由器自定義路由2專線ZStack 云路由網絡互聯網目標地址下一跳VBR接口2192.168.0.0/16目標地址下一跳VBR接口110.200.0.0/16CPE自定義路由1目標地址下一跳10.255.255.22010.200.0.0/16CPE自定義路由2云路由自定義路由1目標地址下一跳專線192.168.0.0/16目標地址下一跳10.255.255.1192.168.0.0/16CPE10.255.255.1VPC路由器接口1邊界路由器VPC自定義路由1目標地址下一跳VPC路由器接口110.200.0.0/16災備場景云盤鏡像快照OSSZStack阿里云