GTC China 2018: AMAX 重磅推出“類腦智能計算一體機”聯合解決方案
發布時間: 2018年11月22日  閱讀次數:3902

GTC CHINA 2018 年11月20日~22日在蘇州舉行,有破紀錄的5,000多名與會者參加。AMAX 作為NVIDIA重要的合作伙伴參加了本次盛會,并在大會上正式發布“類腦智能計算一體機”整體解決方案。

NVIDIA黃仁勛發表GTC CHINA 2018主題演講

GTC是AI和深度學習領域的科技盛會。NVIDIA創始人兼首席執行官黃仁勛發表了GTC CHINA 2018主題演講,重點仍然集中在人工智能領域,包括:新的Turing 通過光線追蹤和Al重塑圖形學;新的HGX-2加速了HPC;新的T4加速了超大規模數據中心;RAPIDS加速了機器學習和數據分析;世界上第一臺用于自主機器的Al計算機AGX Xavier,現已全面投入生產。其中,T4已經在30天前開始投入生產,并且已有一批包括AMAX在內的中國合作伙伴。百度、阿里巴巴、騰訊等眾多中國大型企業及創新企業的開發者也在此展示了其技術成果及創新性突破,探討具有挑戰性的AI難題,了解如何駕馭AI的力量,塑造全新的AI時代。

AMAX 廖先生在介紹“類腦智能計算一體機”

AMAX在GTC大會上正式發布“類腦智能計算一體機”整體解決方案。解決方案一經亮相,便吸引了全場的注意。這款整體解決方案是AMAX聯合Mellanox、中科類腦和StorSwift共同研究推出的?;裰屑撲?、存儲、網絡等多種設備經過集群管理軟件統一調度,實現硬件資源池化,為多用戶最大化資源利用率的同時,節省了能耗和總體使用成本。

類腦智能計算一體機,顧名思義,就是將原有機架和機器分離的架構進行融合,打包成為一個完整的可交付產品。類腦智能計算一體機”將電源、散熱、交換等重要的IT??榧稍諞桓齷裰?,形成一個整體。根據用戶的特定應用需求,調整不同節點的配置,靈活滿足不同的應用對硬件資源的要求。

產品具有顯著的優勢:

-支持多種模式:支持Spark分布式計算集群,支持TensorFlow、Caffe、MxNet、CNTK等主流深度學習框架,支持SKLearn、XGBoost等傳統機器學習方法,提供統一的模型算法配置方案;

-豐富的訓練模型,多領域應用:訓練模型包括CNN、RNN、LSTM、DBN等,開放接口具備插件式集成算法服務能力,支持圖像識別、語音識別、自然語言理解等多個領域的應用驗證;

-算法評估:算法能力測試評估環境,并提供相應的性能基線,實現最合適的計算配置;

-一站式模型訓練測試服務: 通過平臺可視化的操作界面,可以完成模型訓練任務的創建、運行、結果比對,無需關注繁瑣的運行環境;

-教學培訓與實驗:平臺提供人工智能人才學習素材和友好的調試環境,方便初學者和學生群體入門訓練,可以實現課程實驗和教學評估;

-數據智能處理:可提供數據采集、清洗、規范化處理和智能標注等功能。

該平臺還可提供算法集自動篩選和在線教學。其中,算法集與數據集相互聯動,用戶可以通過運行相同的數據集,直觀比較不同算法的效率。在線教學的難度提供多種選擇,與學生能力相匹配,適合不同程度的學生實踐。985大學的專家教師團隊在線授課,提供教學課件,并提供在線答疑,提升教學質量。

類腦平臺應用圖

產品可廣泛適用于以下場景:

-圖像:醫學影像、交通圖像、遙感圖像、人臉圖像等;

-視頻:安防監控、航運、陸運交通、自動駕駛等;

-語音:中文普通話、各地方言、多國語種、領域智能語音等;

-文本:社交網絡、多語種、細粒度標注、領域知識庫等;

-腦圖譜:100+小鼠腦圖譜、靈長類腦圖譜;

-地質:礦產、地層、應力等;

-生物基因:2000+套生物基因組。

硬件方面,整體解決方案采用AMAX 高性能服務器、Mellanox交換機STORSWIFT分布式存儲系統。

AMAX 高性能服務器采用創新工業設計,在視覺和性能上帶來極致體驗。大容量數據存儲能力、強大計算能力和出色擴展性,可輕松運行數據密集型應用程序。

管理節點高可用性,當一臺管理節點宕機時,自動切換,保證機柜整體穩定運行,高效調整系統以獲取最優性能,幫助進行功能規劃,預測故障,出現故障時執行根源分析。

GPU計算節點:最多支持30片Tesla V100 GPU;最高可達153,600 CUDA;最高可達19,200 Tensor核數;混合精度最高可達3.60 PFLOPS;單精度最高可達450 TFLOPS;雙精度最高可達225 TFLOPS;核心頻率可達4110 MHz;顯存帶寬可達900GB/秒。

CPU計算節點:最多支持336核心,672線程;最多支持288個DIMM4內存插槽;最高支持36 TB DDR4 ECC內存;支持高達9.6 GT/s英特爾快速通道互聯。

42U“類腦智能計算一體機”示意圖

為了保證存儲資源的高效分配和使用,以及業務的連續性,解決方案采用Mellanox交換機作為集群的互連設備。Mellanox Infiniband具有低延時高吞吐量的強大性能,可以極大的提升數據中心效率,在應用和系統之間快速的傳遞速率,提升系統可用性。

STORSWIFT分布式存儲系統完全滿足高性能數據庫的要求,不僅具有超高的IOPS,同時也具有超低延遲。簡單靈活便于部署,可靠安全性能卓越。采用全對稱架構,多重數據?;せ?,從多個維度保障數據可靠性,在節點間/節點內,磁盤間/磁盤內提供多維度冗余?;?,使數據更加可靠,并自主研發出并發文件流加速算法,極大的提升大規模數據讀寫性能。

軟件方面,解決方案采用了AMAX自主研發的AI MAX深度學習平臺和中科類腦智能開放平臺。

AI MAX深度學習平臺平臺上,客戶可以在這個平臺上通過用戶界面提交任務,并擁有獨立的存儲空間。AI MAX是一款Kubernetes+Docker+GPU架構,定位于機器學習的上層應用,幫助用戶快速開始深度學習任務的深度學習管理平臺。此外,AI MAX可提供多個Restful API,方便客戶二次開發。

中科類腦智能開放平臺依托開源分布式計算框架和深度學習框架,支持訓練、推理,支持CNN、RNN等各種類型的網絡模型,支持XGBoost等傳統機器學習模型,同時利用容器技術對計算資源進行虛擬化。以智能調度的方式對外提供計算服務,以開源分布式計算、深度學習技術、多領域應用支持、自動調度能力,打造類腦智能計算中心,綜合計算、數據、技術等面向人工智能應用的開源創新平臺。提供海量標注數據+先進人工智能算法+高效智能計算系統+人工智能交流等對接服務。

“類腦智能計算一體機”具有高密度、高能效、整體化設計三大優勢。同時類腦智能開放平臺廣泛支持以深度學習為代表的各種機器學習算法的調試、訓練與業務支撐,旨在提升科研支撐力度,提高AI頂尖人才培養水平,賦能產業轉型升級,降低人工智能創新門檻。AI Max不僅提供豐富的機器學習鏡像,而且在設計中整合了計算、存儲和網絡資源,能夠動態調配計算資源池,在一個界面上,用戶可以實現存儲的管理分配,并對CPU、內存、GPU等資源進行管理,支持靈活高效地節點拓展,增加資源來滿足業務的增長。“類腦智能計算一體機”是未來中小型數據中心主流服務器形態的演變趨勢,搭配可視化管理軟件,可以輕松實現簡易化智能管理,在數據中心服務器容量不斷提升的現狀下,減輕客戶運維成本。

關于AMAX

AMAX 于1979 年創立于美國硅谷,是高性能計算、數據中心以及定制化服務器解決方案值得信賴的領先企業及業界標桿,于2015年完成美國、中國、歐洲的全球布局。

AMAX中國成立于 2000 年,已逐步完成以蘇州為核心,輻射北上廣深、覆蓋二、三線城市的發展布局,并持續向內地進軍。進入中國市場十多年,AMAX中國深耕教育科研行業,大力發展企業客戶,形成以高性能計算為核心、企業級綜合IT及服務器應用系統孵化為擴展的完整解決方案體系。

AMAX與知名軟硬件提供商均建立戰略合作伙伴關系,是英偉達NPN Elite精英合作伙伴,英特爾Cluster Ready項目成員和超融合產品優秀供應商,Linux操作系統巨頭SUSE和Ubuntu全球戰略合作伙伴。