Graphcore為AI工作提供了更便宜,更簡單的方案。
英國晶片設計公司Graphcore近期推出Colossus MK2,又名為GC200 IPU(智能處理單元),在AI應用層面上,公司稱之為全球最複雜的晶片。新晶片的性能是上代產品Colossus MK1的八倍,由594億個晶體管驅動 ─ 超越NVIDIA(NASDAQ:NVDA) 最新頂級A100數據中心GPU的540億個晶體管。
Graphcore計劃把四顆GC200 IPU安裝至一台名為M2000的新機器,其大小與薄餅盒相若,能夠提供1 petaflop(每秒一千萬億次)的運算能力。系統本身比NVIDIA的A100慢,後者的單獨運算能力達5 petaflop。
然而,Graphcore的M2000是隨插即用的系統,用戶可以把多達64,000個IPU連接,實現16 exaflop(每exaflop等於1,000 petaflop)的處理能力。具體來說,假設人類每秒執行一次運算,便需要近317億年,才能媲美1 exaflop系統在一秒鐘內可完成的工作。
GC200和A100均屬功能非常強大的機器,但Graphcore在不斷增長的AI市場,擁有三項更勝NVIDIA的獨特優勢。
1.Graphcore正為不同工作開發特定晶片
NVIDIA把GPU由遊戲和專業視象化用途擴大至AI市場,Graphcore有別於此,專門設計用於機器學習工作的定制IPU,與GPU或CPU不同。
Graphcore在官方網站上聲稱:「CPU設計作辦公用途、GPU用於圖象運算,而IPU則用於機器智能。」 公司解釋,CPU為「標量」處理而設計,一次處理一項數據,GPU則為「矢量」處理而設計,一次處理大量整數和浮點數。
Graphcore的IPU科技運用「圖象」處理,可一次處理各個單一圖象標示的所有數據。公司指IPU的結構比CPU和GPU更能有效處理機器學習工作。許多機器學習框架(包括TensorFlow、MXNet和Caffe)已支援圖象處理。
Graphcore表示,GPU使用的矢量處理模型,比圖象模型「嚴謹得多」,研究人員可在AI研究中「探索新模型或重新探索各個領域」。
2.Graphcore GC200每petaflop處理能力的成本較低
NVIDIA的A100價值199,000美元,相當於每petaflop 39,800美元。相對之下,Graphcore M2000系統提供1 petaflop處理能力的價格為32,450美元。每petaflop 7,350美元的差異,可以為數據中心的多重exflop系統節省數百萬美元。
這可能使NVIDIA的數據中心業務面對嚴峻挑戰,其上季度收益按年增加80%至11.4億美元,佔該晶片製造商總收益的37%。NVIDIA近期收購了數據中心網絡設備製造商Mellanox,希望壯大該業務,但規模擴大也難以阻止Graphcore的革命性研發。
3.Graphcore獲創投基金支持
NVIDIA是一間上市晶片製造商,需要定期檢討其開支慣例,Graphcore則為一間私營初創企業,可以專注於研發和增長,而非短期利潤。
Graphcore僅在四年前成立,但在2月份最後一次融資後,估值已高達19.5億美元。公司的贊助人包括Merian Chrysalis和Amadeus Capital Partners等投資公司,以及微軟(NASDAQ:MSFT)等大公司。微軟已使用Graphcore的IPU,在Azure雲端運算平台處理機器學習工作,其他雲端巨企可能在未來數年跟隨其腳步。
NVIDIA投資者應該擔心嗎?
NVIDIA在數據中心GPU享有先行優勢,但公司面對的挑戰者越來越多,包括來自亞馬遜、Facebook和Alphabet Google的第一方晶片。Graphcore步步進迫,NVIDIA投資者應該警惕Graphcore的新晶片 ─ 它似乎有能力提供更便宜,更精簡靈活的方式,處理機器學習和AI工作。