1、7天從開發到上線,云上高效運維實踐與探索黃 繼映客高級技術總監 2017年加入映客,目前負責運維、基礎架構、大數據和中臺業務等技術管理工作 20072017 分別在百度、美團、小米,參與和負責過SRE自動化運維體系建設、容器化PaaS建設、IDC基礎設施管理和自動化建設等01映客業務的效率問題與挑戰02應對思路與實踐探索03未來方向與規劃Contents目錄40業務線 10+/年業務立項快上線時間短問題與挑戰效率產生的新問題服務質量功能迭代數據運營問題與挑戰必要功能需求多迭代變化快多方對接內部流程影響效率業務迭代業務優先服務質量數據產出慢基本數據不完整口徑不一致、不準確數據運營主要矛盾7 1
2、1問題與挑戰思路與目標讓業務更專注業務敏捷解耦復用場景應對與實踐業務場景閉環標準服務組件統一資源管理統一服務架構應對與實踐組件與場景化發展三方服務中臺服務熱修復播放/發布音視頻通用埋點登錄支付資源定位基礎庫服務發現上傳加解密CICD/部署主機管理域名管理LB管理DB管理安全組管理大數據投放運營統一資源管理多云支持去差異自有體系成本管理統一資源管理運難體系基礎構建監控CMDB服務樹域名管理DB管理LB管理主機管理安全組管理預算管理快速擴容CloudAPI成本和利用率分析內網DNS安全測試統一資源管理Appid:業務的唯一標識(inke)ServiceName:模塊的唯一標識(inke.room.
3、play.social)ServiceTag:資源的唯一標識(cop.inke_owt.bpc_pdl.room_servicegroup.room_service.play_job.social_cluster.ali-bj)業務自動化運維的起點AppIDHostServiceNameServiceNameServiceTagServiceTag統一資源管理業務自動化運維體系數據大盤流量投放SaaS配置映客云KAE服務樹元數據業務模塊遠程配置監控運維平臺資源開通數據接入模型清洗注冊/配置globalTag統一服務架構通用開發框架發布監控包管理工具CILint腳手架遠程配置Trace服務研發設
4、施日志RPCMetricMySQLClient熔斷限流服務發現HTTPRedisClientNameSpaceApp FrameworkConsulSQL/NoSQLKafka錄制回放VMDNSK8SFLUME通用服務組件Gateway短信推送長連接DTS上傳加解密埋點IP/GPS動態URL性能采集登錄/支付發布/播放熱修復網絡優選通用埋點音視頻客戶端服務端通用服務組件三方服務通用化封裝MediaRoom接口層Android平臺iOS平臺MediaAPI接口層Android邏輯實現層iOS邏輯實現層房間信令模塊映客SDK(移動SDK接口分層設計圖)高級易用接口層低級穩定接口層中臺和業務場景化用
5、戶金融IM注冊/登錄風控數據可視化推廣投放支付風控對賬數據可視化消息審核風控服務組件自助對接中臺和業務場景化支撐業務探索賽道讓業務更專注業務研發人員業務跨業務靈活遷移適當降低經驗要求減少開發工作量自助快速接入,30分鐘/組件遷移升級更透明相對成熟的功能,避免踩坑默認功能整合,Serviceless云原生的業務架構ESHologresEMRFlink視頻轉碼內容安全ECSRDSRedisK8SSLBOSSNASDDoSWAF高速通道邊緣計算VPN短信ARMS100%公有云化 云是IaaS?PaaS?SaaS?使用云產品還是自研?混合云或多云架構需不需要?一些問題與思考可控性低投入遷移性 多云熱備架構,遷移能力加強 中臺化建設,海外能力 更多場景化整合,客服、智能投放等未來方向與規劃THANKS