1、騰訊云機器學習平臺 騰訊云機器學習人工智能成果介紹 騰訊云機器學習平臺 騰訊云機器學習示例在ICDAR 比賽中刷新Focused Scene Text挑戰的Text Localization項目世界紀錄2017年3月2017年4月在LFW無限制條件下人臉驗證測試中,優圖提交的最新成績為99.80%,提升了上次99.65%的成績,再次在這一測試中刷新紀錄。2017年3月在國際權威海量人臉識別數據庫MegaFace中,以83.290%的最新成績在100萬級別人臉識別測試中拔得頭籌騰訊領先全球的圖像識別能力優圖實驗室2017獲獎記錄2017年11月獲得第14界ICDAR的四項冠軍騰訊智能語音能力積淀
2、每月9億微信、8億QQ用戶體驗服務騰訊云300+企業客戶為騰訊內外部包括王者榮耀、龍之谷等50余款游戲提供服務每天6000萬+次語音請求處理在騰訊研究院誕生服務QQ瀏覽器、QQ音樂、騰訊視頻等主流業務戰略籌劃內部驗證外部開放日處理語音時長峰值5000+小時服務招行、南方航空、珍愛網、知乎、北京知識產權法院等2011年2016年這是怎么做到的?騰訊云機器學習平臺騰訊云GPU騰訊云FPGA騰訊云GPU云服務GPU計算型計算型 云服務器云服務器(GPU Cloud Computing)基于GPU的應用于視頻編解碼、深度學習、科學計算等多種場景的快速、穩定、彈性的計算服務我們提供和標準云服務器一致的管
3、理方式,方便快捷出色的圖形處理能力和高性能計算能力為您提供極致計算性能,有效解放您的計算壓力,提升產品的計算處理效率與競爭力。GPU計算可以實現高并行計算和高計算吞吐,適用于計算密集、高并行尤其擅長圖形圖像、矩陣計算等方面的應用騰訊云FPGA云服務FPGA云服務器(云服務器(FPGA Cloud Computing)基于FPGA(Field Programmable Gate Array)現場可編程陣列的計算服務您只需單擊幾下即可在幾分鐘內輕松獲取并部署您的FPGA計算實例您可以在FPGA實例上編程,為您的應用程序創建自定義硬件加速我們為您提供可重編程的環境,您可以在FPGA實例上多次編程,而
4、無需重新設計硬件,讓您能更加專注于業務發展專業可靠的FPGA平臺,硬件可編程、低功耗、低延時,讓您不再受硬件問題困擾。異構計算 概述備注:以上為微軟研究人員分析了CPU、GPU以及FPGA對BLAS(Basic Linear AlgebraSubprograms,基礎線性代數程序集)的加速以及能耗。算法能耗對比(單位:毫焦)算法消耗能量,越低越好算法性能對比(單位:微秒)算法運行所需時間,越低越好騰訊云人工智能產品方案矩陣大數據分析適用場景解決方案AI應用服務AI框架騰訊大數據平臺騰訊機器學習平臺智慧法庭人臉核身智能監管與審核社交娛樂類應用智能門禁/閘機/考勤公民身份認證智能物流計算機視覺智能
5、語音GPU云服務器黑石基礎設施服務語音關鍵字檢索CPU云服務器FPGA云服務器人臉識別圖像識別文字識別OCR語音識別語音合成語音關鍵詞檢索人臉識別圖像識別文字識別OCR語音識別語音合成語音關鍵詞檢索人臉識別圖像識別文字識別OCR語音識別語音合成 騰訊云機器學習人工智能成果介紹 騰訊云機器學習平臺 騰訊云機器學習示例機器學習的典型流程原始數據原始數據數據預處理數據集學習算法目標模型部署模型模型服務機器學習的痛點原始數據原始數據數據預處理數據集學習算法目標模型部署模型模型服務數據從哪里來?有哪些可用的方法?中間數據存到哪里去?TensorFlow/Caffe如何選擇?CNN?RNN?SVM?數據量
6、好大,集群如何搭建?模型出來了,如何提供服務?算法開發算法使用模型選擇模型部署模型訓練團隊協作算法層機器學習算法特征工程分類聚類回歸關聯規則圖算法個體中心鄰居相關社區劃分深度學習算法CNNRNNDNN框架層SparkPythonRGraphXAngelTensorFlowMariana騰訊云機器學習平臺資源層CPUGPUFPGACOSHDFSHBaseCeph騰訊云機器學習平臺基于騰訊云強大計算能力的一站式深度學習平臺,它能夠讓算法工程師和數據科學家以可視化的拖拽形式組合組件和算法,以使用深度學習技術,對語音、文本、圖片、視頻等海量數據進行離線模型訓練、在線模型預測及可視化模型評估。騰訊云機器
7、學習平臺TensorFlow圖像識別精準推薦GPU/CPUCaffeTorch語音識別拖拽式深度學習離線模型訓練可視化模型評估實時風控在線模型預測其他應用場景COS騰訊云機器學習平臺核心能力540+19626數據源公共數據集機器學習框架算法模型評估方法騰訊云機器學習平臺核心能力輸入數據源團隊模型業界數據集組件數據分析機器學習深度學習算法數據預處理機器學習算法圖算法深度學習算法模型個人模型團隊模型業界模型輸出可視化評估騰訊云機器學習平臺 機器學習算法(部分)數據預處理DataSamplingFlatternSpliter特征提取HashingTFTF IDFWord2VecWordSegment
8、特征轉換ADMM-DummyDiscreteDummyNormalizerPCARandomizedSCDScalerSVDTransformByGBDT特征選擇Information BasedChiSqSelectorCorrelationFeatureImpByGBDTMultualInformation異常檢測IsolationForest分類ADMMDecisionTreeGBDTLRNaiveBayesRandomForestSVM騰訊云機器學習平臺模型服務模型A模型B模型C騰訊云機器學習APIAI應用騰訊云騰訊云機器學習平臺騰訊云機器學習平臺資源管理騰訊云FPGAGPUCPU黑石
9、租戶C資源池資源池租戶B資源池租戶A資源池資源池共享資源池騰訊云機器學習平臺騰訊云機器學習平臺 團隊協作數據共享以通信和社交為核心連接人和人之間的溝通交流流程共享連接互聯網和各行各業,資訊和服務在新的領域創造新的生態服務共享以互聯網為媒介給未來生活豐富可能性騰訊云機器學習平臺-核心理念數據驅動任務流可視化操作騰訊云機器學習平臺-核心理念數據驅動任務流可視化操作數據模型訓練集校驗集模型評估預處理&特征工程訓練算法測試集騰訊云機器學習平臺-告警監控時長監控狀態監控郵件/短信告警騰訊云機器學習平臺-任務調度騰訊云機器學習平臺 騰訊云機器學習人工智能成果介紹 騰訊云機器學習平臺 騰訊云機器學習示例示例 游戲流失率預測反舞弊技術反舞弊技術人臉識別人臉識別征信系統征信系統典型案例GPU金融:微眾銀行FPGA 典型案例廣告推薦17*200*20*1 的 4 層DNN模型,4000個樣本4000 個樣本為 個集合模型服務騰訊云機器學習平臺產品預測廣告推薦應用核心智能算法和模型組件HDFSCephHBaseTDW表TDE存儲計算GPUCPU算法CNNRNNLRSVMKMeansALSKCoreLPAFPGASparkAngelTensorFlowMarianaSparkStreaming模型趨勢模型人群模型語音模型推薦模型傳播模型圖像模型資源層Appendix:騰訊云機器學習平臺架構內存