AI Max 是 AMAX一款基于 Kubernetes+Docker+GPU 架構,定位于機器學習的上層應用,免去客戶編寫代碼的麻煩,快速開始深度學習任務的平臺。軟件基于容器基礎,內置多種深度學習框架,兼具細粒度的權限管控,完善的數據與鏡像的存儲、隔離,提供多種交互式開發及 API 接口,可滿足多用戶、多場景的需求。

 

 

架構介紹

 

基礎層

基礎設施以硬件服務器為載體,支持主流 X86 服務器,配置 NVIDIA GPU 實現高性能加速計算,采用主流分布式存儲設備(如:XP-42305ST ),支持 TCP/IP,InfiniBand 高速網絡互聯。

 

AI Max 平臺層

平臺層是整個系統的核心,包含操作系統、GPU 驅動、CUDA、CuDNN、機器學習框架、資源調度和完整的機器學習所需的處理流程,實現資源操作自動化,并向用戶提供應用交付服務。