人工智能云計算平臺解決方案
-
人工智能云計算平臺解決方案(1/2)
-
人工智能云計算平臺解決方案(2/2)
曙光人工智能云計算平臺解決方案提供快速、穩(wěn)定、彈性的GPU計算資源。同時平臺集成了數(shù)據(jù)集管理、模型管理、訓(xùn)練等服務(wù),支持Caffe/TensorFlow等多種深度學(xué)習(xí)框架,靈活的資源調(diào)度策略,使訓(xùn)練過程更加高效、彈性。極大的簡化了企業(yè)構(gòu)建深度學(xué)習(xí)平臺的難度,提高資源使用率,降低了業(yè)務(wù)投入成本,使用戶更加專注于深度學(xué)習(xí)應(yīng)用本身。主要應(yīng)用于深度學(xué)習(xí)訓(xùn)練/推理、圖形圖像處理以及科學(xué)計算等場景。
曙光人工智能云計算平臺解決方案底層依托云計算的彈性資源,中層則采用XMachine高性能集群組成云GPU計算平臺。計算數(shù)據(jù)、日志log和模型數(shù)據(jù)統(tǒng)一存儲在曙光ParaStor300分布式并行存儲中。并通過曙光容器化的企業(yè)級分布式深度學(xué)習(xí)平臺,提供數(shù)據(jù)集管理、模型管理、訓(xùn)練等服務(wù)。幫助用戶解決多用戶組資源分配、開發(fā)環(huán)境快速搭建、應(yīng)用程序靈活遷移等技術(shù)需求。該系統(tǒng)以主流深度學(xué)習(xí)框架為基礎(chǔ),支持Caffe/TensorFlow等多種深度學(xué)習(xí)框架,與Kubernetes和Docker容器技術(shù)相結(jié)合,提供實驗環(huán)境、離線任務(wù)和在線服務(wù)三大功能,支持業(yè)務(wù)從模型研究、批量訓(xùn)練到在線預(yù)測的全流程打通,完美的滿足了一站式深度學(xué)習(xí)訓(xùn)練與實時推理的需求,是目前具有高性價比的整體 AI 訓(xùn)練與推理解決方案。