服務熱線
0755-83044319
發布時間:2024-05-07作者來源:薩科微瀏覽:1130
IT之家 5 月 4 日消息,上周召開的臺積電(TSMC)北美技術研討會上,特斯拉表示專門用于訓練 AI 的晶圓級 Dojo 處理器已經投入量產,距離部署已經不遠了。
特斯拉的 Dojo 晶圓上系統(system-on-wafer)處理器(特斯拉官方稱其為 Dojo Training Tile)采用 5*5 陣列共計 25 顆芯片,這些芯片放置在載體晶圓上,然后使用臺積電的集成扇出(InFO)技術進行晶圓級互連(InFO_SoW)互連。
據 IEEE Spectrum 報道,InFO_SoW 技術旨在實現高性能連接,讓特斯拉 Dojo 的 25 個芯片可以像 1 個處理器一樣工作;同時為了讓晶圓級處理器保持一致,臺積電用虛擬芯片填充了芯片之間的空白點。
特斯拉晶圓級 Dojo 處理器實際上包含了 25 個超高性能處理器,耗電量非常高,因此需要復雜的冷卻系統。
特斯拉為了滿足 Dojo 處理器的供電需求,使用復雜的電壓調節模塊,為計算平面提供 18000 安培的電力,散發的熱量高達 15000W,因此需要水冷散熱。
特斯拉尚未透露其 Dojo 晶圓系統的性能 —— 不過,考慮到其開發過程中面臨的所有挑戰,它似乎有望成為人工智能訓練的一個非常強大的解決方案。IT之家附上相關圖片如下:
晶圓級處理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圓級引擎 (WSE),比多處理器機器的性能效率要高得多。它們的主要優點包括內核之間的高帶寬和低延遲通信、降低的電力傳輸網絡阻抗以及卓越的能源效率。此外,這些處理器可以受益于擁有冗余的“額外”核心 —— 或者,對于特斯拉來說,擁有已知良好的處理器核心。
特斯拉的Dojo處理器是專門為人工智能訓練設計的晶圓級處理器,具有以下顯著特點:
1. 高集成度:Dojo處理器采用5x5陣列,共計25顆芯片,這些芯片放置在載體晶圓上,并使用臺積電的集成扇出(InFO)技術進行晶圓級互連(InFO_SoW)。
2. 高性能連接:InFO_SoW技術旨在實現高性能連接,讓25個芯片可以像1個處理器一樣協同工作。
3. 高耗電與冷卻需求:由于Dojo處理器耗電量非常高,因此需要復雜的冷卻系統,特斯拉為此設計了專門的電壓調節模塊和水冷散熱系統。
4. 專用于AI計算:Dojo核心具有類似CPU的風格,比GPU更能適應不同的算法和分支代碼,并且具有專注于加速AI計算的自定義向量指令。
5. 存算一體架構:D1芯片采用存算一體架構,運行在2GHz,擁有巨大的440MB SRAM,提供近存計算的優勢。
6. RISC-V架構參:D1處理器的指令集參考了RISC-V架構,并自定義了一些指令,特別是矢量計算相關的指令。
7. 高算力密度:Dojo核心提供了1.024TFLOPS的算力,且幾乎所有的算力都由矩陣計算單元提供。
8. 數據流近存計算架構:D1處理器擁有分布式SRAM,通過大量更快更近的片上存儲減少對內存的訪問頻度,提升系統性能。
9. 高帶寬和低延遲:Dojo處理器的NoC網絡可以處理跨節點邊界的數據同步,提供高帶寬和低延遲的通信。
10. 定制化架構:Dojo是一套完全可定制的架構,全面涵蓋計算、網絡、輸入/輸出(I/O)芯片。
11. 潛力巨大:據分析,Dojo有潛力為特斯拉增加巨額市值,特別是在移動和網絡服務方面的應用。
12. 先進封裝技術:Dojo訓練模塊采用先進的InFO_SoW封裝技術,提高芯片間的互連密度。
13. 高性能計算:Dojo處理器由臺積電制造,采用7納米工藝,擁有500億個晶體管,芯片面積為645mm2,小于業界同類產品。
這些特點使得特斯拉的Dojo處理器在人工智能訓練領域具有潛在的高性能和高效率,有望成為AI計算的強大解決方案。
免責聲明:本文原創作者張國斌,本文僅代表作者個人觀點,不代表薩科微及行業觀點,只為轉載與分享,支持保護知識產權,轉載請注明原出處及作者,如有侵權請聯系我們刪除。
友情鏈接:站點地圖 薩科微官方微博 立創商城-薩科微專賣 金航標官網 金航標英文站
Copyright ?2015-2024 深圳薩科微半導體有限公司 版權所有 粵ICP備20017602號