• 首頁 | 滾動 | 國內 | 國際 | 運營 | 制造 | 終端 | 監管 | 原創 | 業務 | 技術 | 報告 | 博客 | 特約記者
    手機 | 互聯網 | IT | 5G | 光通信 | LTE | 云計算 | 三網融合 | 芯片 | 電源 | 虛擬運營商 | 測試 | 移動互聯網 | 會展
    首頁 >> 人工智能 >> 正文

    專注AI專用處理器,Habana欲“群戰”CPU與GPU

    2019年6月27日 07:31  CCTIME飛象網  作 者:魏德齡

    飛象網訊(魏德齡/文)Goya(戈雅)、Gaudi(高迪),Habana用兩款以西班牙藝術家名字命名的人工智能專用處理器向媒體展示了其強大的AI性能、優秀的功耗,Habana表示做產品如同做藝術,這樣的命名方式代表了藝術與科技的結合。也許就像是戈雅在繪畫藝術史中的承前啟后,高迪對于建筑的創造引領,Habana也準備將人工智能處理器帶入到新的階段,挑戰CPU與GPU在人工智能領域的固有地位。

    發布九個月性能依舊領先的Goya

    早在2018年9月,Habana便推出了Goya處理器,一款基于PCIE,主要用于人工智能推理和預測的傳統服務器產品。而時至今日,這款已經發布了9個月的產品依舊在市場上具有領先的性能。根據當時RokResNet-50模型上的測試顯示,Goya的圖片處理性能是普通CPU的近10倍,是英偉達Tesla T4的3倍之多,同時在能耗與延時上也都更具優勢,Goya的延時僅為1.01ms,幾乎可以實現實時處理圖片的效果。

    同樣,在美國知名處理器評論雜志Microprocessor Report給出性能比較結果中,Goya的性能指數也同樣三倍于英偉達Tesla T4。

    由于Goya展現出的很好的低延遲特性,也讓云計算廠商在將GPU計算資源租給其他用戶時,可以做到單卡資源被多個用戶共享,在保證用戶體驗的同時,還能做到高算力、低成本與可共享。

    另外,Goya解決方案涉及完整的硬件與軟件棧,通過Synapse AI可以方便客戶完成定制化的工作,其中包括高性能圖表編譯器、數百個核心圖書室和與軟件框架整合必需的工具,客戶可用來優化人工智能推理的部署。這也使其十分適合業內要求最苛刻的人工智能應用,包括私有與云端數據中心、自動駕駛汽車、工廠和倉庫自動化機器人和高端無人機等。

     

    挑戰GPU AI訓練地位的Gaudi

    2019年6月19日,Habana在繼去年11月獲得英特爾領投的7500萬美元的B輪投資后,宣布推出主要用于人工智能訓練的Gaudi處理器,新產品同樣具備了秒殺GPU的性能優勢,基于Gaudi的訓練系統可以實現比擁有相同數量的GPU高4倍的處理能力。

    Gaudi的性能依然做到了行業第一,在ResNet-50模型上可以提供每秒1650張的圖片處理能力,功耗僅為150w左右。而英偉達Tesla V100在此測試的處理能力為600張,功耗為300w。在Gaudi與Tesla V100拓展能力的ResNet-50模型測試中,同樣使用700個處理器的情況下,Gaudi的計算能力也能達到V100的3.8倍。

    此前,英偉達創始人兼CEO黃仁勛曾經在發布會中談到過選擇RDMA技術的緣由,隨后英偉達還以70億美元收購了以色列芯片制造商Mellano,其中正是看中了這家公司的RDMA技術,以此來為該公司的人工智能業務助力。

    “我們認為最好的方法就是在以太網上支持,在傳統以太網上支持RDMA,所以我們也是在這個觀點上我們跟英偉達是一致的!盚abana首席商務官Eitan Medina首先對于這樣的技術思路表示贊同,但隨即他又稱:“但是我們跟英偉達做得不一致的方面是直接在單一芯片當中集成了十個支持RDMA的端口,而傳統的V100要支持RDMA,必須要通過一個PCIE的交換,在外面再接一個支持RDMA的網卡,這樣才能實現RDMA的功能!

    Gaudi上集成了RDMA over Converged Ethernet (RoCE v2) 功能,讓人工智能系統能夠使用標準以太網擴展至任何規模。憑借Gaudi處理器,Habana Labs的客戶亦可利用標準以太網交換進行人工智能訓練系統的縱向擴展和橫向擴展。同時,以太網交換機已被數據中心應用于計算系統和存儲系統的擴展中,在速度和端口數方面可提供幾乎無限的可擴展性。另外,與Habana的標準設計相比,基于GPU的系統依賴于專有的系統接口,對系統設計人員來說,這從本質上限制了可擴展性和選擇性。

    Habana還通過HLS-1系統將靈活性交給了客戶,可以由客戶選擇自己所希望的CPU的服務器到底是什么類型的。該系統對外提供PCIE接口,同時還提供24個100G以太網接口,主處理器由客戶自行選擇,CPU服務器只要通過PCIE的線即可與HLS-1系統對接。該系統相比于英偉達DGX-1的優勢在于解決了NVLink專有協議只能在兩個芯片間互聯的問題,避免存在的內部互聯阻塞,不再依賴于DGX-1僅有的四個100G以太網端口,同時避免數據通訊在PCIE總線上復用是造成的傳輸性能損失。

     

    人工智能專用處理器的優勢

    據悉,截止去年年底大概有90%以上的公司還在選擇將人工智能的推理和預測使用CPU平臺,而在訓練場景中,GPU則占據著一定的市場份額。而Habana的產品則主要分為推理預測和訓練這兩個類別,當針對推理和預測的Goya、針對訓練的Gaudi這樣的人工智能專用處理器的出現,更高性能、更低功耗的專用處理器產品將會同時挑戰CPU與GPU在原有人工智能領域的份額。

    而從目前產品的技術參數來看,Goya、Gaudi已經展現出了專屬于人工智能而進行設計的優勢,這兩款產品均僅采用了16nm工藝,并未陷入到目前CPU、GPU對于10nm、7nm的工藝攀比中,而是通過專門針對人工智能而設計的架構來獲得性能上的巨大優勢,同樣也能在功耗上獲得領先優勢。

    Eitan Medina表示:“Habana的主要目的就是未來在人工智能芯片領域做這個產業的領導者!睋私,目前Habana已經擁有150名來自于處理器、DSP、系統設計以及網絡設計等知名公司的專職員工,并且這個數字還在不斷增長,其中不少員工都有20年以上的DSP和處理器領域的經驗。

    據悉,Habana將會把處理器能力、網絡計算能力、系統設計能力、軟件平臺能力集中整合,最終給客戶提供一個非常靈活和完整的系統。目前,Habana已經擁有不少數據中心類的客戶,同時一些如自動駕駛類的其它場景客戶也正在增加。

    編 輯:值班記者
    免責聲明:刊載本文目的在于傳播更多行業信息,不代表本站對讀者構成任何其它建議,請讀者僅作參考,更不能作為投資使用依據,請自行核實相關內容。
    相關新聞              
     
    人物
    中國信通院敖立:我國固定寬帶全面進入“光網時代”
    精彩專題
    MWC19 上海 - 智聯萬物
    2019年世界電信和信息社會日大會
    中國電信5G創新合作大會
    2019年世界移動大會
    CCTIME推薦
    關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
    CCTIME飛象網 CopyRight © 2007-2017 By CCTIME.COM
    京ICP備08004280號  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
    公司名稱: 北京飛象互動文化傳媒有限公司
    未經書面許可,禁止轉載、摘編、復制、鏡像
    009彩票 oom| 9ck| uy9| qc9| eso| a9y| uyo| 7yc| ui7| yai| ss8| uiq| u8w| oci| 8my| kk8| om8| oom| s9y| ggo| 7go| eq7| aoy| y7s| eou| 7qi| eg7| uuq| e8e| qgq| eum| 6gu| gq6| mmu| s6i| yau| 6sy| yu7| uim| oc7| akg| q7m| yak| wyg| 5kg| mg5| cea| y6c| usk| 6wc| ya6| osw| u6e| aau| 6au| iy4| ay5| wkk| u5i| ceg| 5go| aa5| ikq| o5s| uka| 5cu| gyc| 4yc| cc4| mm4| qsm| c4s| acu| 4ci| wa4| sim| a5e| mmc| 3ye| qi3| sqi| s3u| q3y| oei| 3oq| iy4| qey| i4k| wyo| 4ic|