AI演算法提供商原本提供AI演算法、機器學習API等產品,因擁有AI訓練的伺服器,開始拓展為提供高階GPU算力的解決方案與租借。(網路照片)
過往伺服器託管與算力租賃主要由兩大類型的廠商進行協助,分別是資料中心託管商(如Equinix、Digital Reality等)與雲端資料中心廠商(AWS、Azure、Google)。資料中心託管商主要提供資料中心的空間與機櫃,協助資料中心電力設備(UPS)、散熱、資安等服務,伺服器則是由租賃櫃位的廠商自行採購,伺服器硬體設備所有權亦掌握於企業手中。雲端服務商是在自建的資料中心當中放置伺服器,此些伺服器除可支撐雲端服務外,更透過虛擬化的方式提供虛擬機器(VM)、應用實例(Instance)給客戶進行租借。
2023年生成式AI應用竄升,促使各企業對AI算力需求大幅提升,然而提供AI算力的AI伺服器具備單價過高、採購不易,以及對於其他設備規格要求更高等特點,企業要自行採購相對困難,且全球皆有供不應求的狀況發生。在此情形下,一批新型態的廠商逐漸浮出水面,即為租借AI算力、高階GPU算力的GPU運算/GPU雲提供商。此類廠商在自身的資料中心部署大量的AI伺服器來集成AI算力,並將AI算力透過VM或Instance的方式提供需要使用的企業。與此同時,AI算力增加對資料中心託管商及雲端服務商形成不同程度的問題,也讓GPU運算提供商找到商機。
雲端服務商不足以完全滿足AI算力市場需求,促使GPU運算提供商崛起,主要是抓準即時使用需求,給予中小型企業使用高階AI算力的機會。而GPU運算/雲提供商是由不同類型的業者轉型而成,當前主要由四種業者轉型而成,包含裸機服務提供商、AI演算法提供商、虛擬貨幣挖礦業者及超級電腦提供商/科研機構。
裸機服務提供商過去提供CPU、低階GPU的裸機伺服器服務,將實體伺服器擺放於資料中心,並租賃給客戶使用。AI演算法提供商原本提供AI演算法、機器學習API等產品,因擁有AI訓練的伺服器,開始拓展為提供高階GPU算力的解決方案與租借。虛擬貨幣挖礦者是過去大量採購礦機來挖取虛擬貨幣,在虛擬貨幣價格大幅波動及生成式AI需求驅動下,轉型為GPU運算的提供商。超級電腦提供商是提供超級電腦或資料中心基礎設施的硬體設備商,因具備設計叢集架構的能力,進展到提供GPU算力的租借。
GPU運算/雲提供商受到投資者關注,如CoreWeave,輝達、微軟均對其投資與合作。CoreWeave成立於2017年,原為以太坊挖礦公司,2019年轉型為GPU運算公司。2023年4月獲得輝達領頭的2.21億美元B輪融資。輝達與Coreweave的合作關係,也讓其在獲得H100 GPU供貨上甚至比大型雲端服務商更有優勢。2023年6月,微軟與Coreweave簽署協議,未來數年將投資使用其提供的雲端運算基礎設施。
2023年全球第二大獨角獸企業Inflection AI宣布,將與Coreweave及輝達共同打造全球最大的AI叢集/超級電腦,將包含2.2萬顆輝達H100 GPU。AI算力已成為大型CSP與AI新創能否提升市占率或崛起的關鍵因素,因高階GPU供貨有限,促使大型CSP業者將搶占GPU運算提供商提供的AI算力。展望未來,AWS、微軟及Google等CSP業者除自行部署AI算力,向GPU運算/雲提供商租借算力或合作部署將是重要的AI算力來源。
AI算力是布局生成式AI的企業必須部署的重要基礎元件,在高階GPU短缺及需求量增加下,AI算力需求者將會有更多元的採用方式。第一種是向資料中心託管商租借機櫃空間,自行採買伺服器品牌商、ODM廠商提供的AI伺服器產品或輝達DGX系統。此種模式伺服器位於資料中心託管商,而伺服器為自身擁有,建置成本最高,但安全性最高、可自行配置硬體設備等優勢。若要使用雲端服務時,可透過混合雲或託管商提供的串接服務使用。
第二種為使用AWS、微軟、Google等雲端服務商的應用實例,伺服器在雲端資料中心,主要為CSP擁有。此種模式無前期建置成本,但租借費用較高,設備彈性較低。同時在CSP綁約下,要建立長期合約才划算。主要優勢在於和CSP其他雲端應用服務整合性高,對軟體設計能力較弱的公司有吸引力。
第三種為租借GPU運算提供商的AI算力,伺服器位於GPU運算提供商,且伺服器為廠商擁有。優點是無前期建置成本、設備彈性較高,可透過廠商給予的規格選擇需要的伺服器、能夠即時使用。但當前許多廠商鎖定在區域進行供貨,全球布點尚未完善。另外,伺服器共用,在一個客戶租完後即會開放給其他客戶使用,資安相對不佳。
生成式AI蓬勃發展,當前AI算力供給量不足以支撐雲端服務商,GPU運算提供商除提供企業級客戶新的算力租借選擇,亦成為雲端服務商獲得AI算力重要合作夥伴。未來在雲端與企業端雙方需求帶動下,GPU運算提供商將由不同類型的廠商轉型,形成全新的租賃模式。(作者是資策會MIC產業分析師)