參考RISC-V架構，25 顆芯片合一，特斯拉晶圓級 Dojo 處理器已量產

發布時間：2024-05-07作者來源：薩科微瀏覽：1786

IT之家 5 月 4 日消息，上周召開的臺積電（TSMC）北美技術研討會上，特斯拉表示專門用于訓練 AI 的晶圓級 Dojo 處理器已經投入量產，距離部署已經不遠了。

特斯拉的 Dojo 晶圓上系統（system-on-wafer）處理器（特斯拉官方稱其為 Dojo Training Tile）采用 5*5 陣列共計 25 顆芯片，這些芯片放置在載體晶圓上，然后使用臺積電的集成扇出（InFO）技術進行晶圓級互連（InFO_SoW）互連。

據 IEEE Spectrum 報道，InFO_SoW 技術旨在實現高性能連接，讓特斯拉 Dojo 的 25 個芯片可以像 1 個處理器一樣工作；同時為了讓晶圓級處理器保持一致，臺積電用虛擬芯片填充了芯片之間的空白點。

特斯拉晶圓級 Dojo 處理器實際上包含了 25 個超高性能處理器，耗電量非常高，因此需要復雜的冷卻系統。

特斯拉為了滿足 Dojo 處理器的供電需求，使用復雜的電壓調節模塊，為計算平面提供 18000 安培的電力，散發的熱量高達 15000W，因此需要水冷散熱。

特斯拉尚未透露其 Dojo 晶圓系統的性能 —— 不過，考慮到其開發過程中面臨的所有挑戰，它似乎有望成為人工智能訓練的一個非常強大的解決方案。IT之家附上相關圖片如下：

晶圓級處理器，例如 Tesla 的 Dojo 和 Cerebras 的晶圓級引擎 (WSE)，比多處理器機器的性能效率要高得多。它們的主要優點包括內核之間的高帶寬和低延遲通信、降低的電力傳輸網絡阻抗以及卓越的能源效率。此外，這些處理器可以受益于擁有冗余的“額外”核心 —— 或者，對于特斯拉來說，擁有已知良好的處理器核心。

特斯拉的Dojo處理器是專門為人工智能訓練設計的晶圓級處理器，具有以下顯著特點：

1. 高集成度：Dojo處理器采用5x5陣列，共計25顆芯片，這些芯片放置在載體晶圓上，并使用臺積電的集成扇出（InFO）技術進行晶圓級互連（InFO_SoW）。

2. 高性能連接：InFO_SoW技術旨在實現高性能連接，讓25個芯片可以像1個處理器一樣協同工作。

3. 高耗電與冷卻需求：由于Dojo處理器耗電量非常高，因此需要復雜的冷卻系統，特斯拉為此設計了專門的電壓調節模塊和水冷散熱系統。

4. 專用于AI計算：Dojo核心具有類似CPU的風格，比GPU更能適應不同的算法和分支代碼，并且具有專注于加速AI計算的自定義向量指令。

5. 存算一體架構：D1芯片采用存算一體架構，運行在2GHz，擁有巨大的440MB SRAM，提供近存計算的優勢。

6. RISC-V架構參：D1處理器的指令集參考了RISC-V架構，并自定義了一些指令，特別是矢量計算相關的指令。

7. 高算力密度：Dojo核心提供了1.024TFLOPS的算力，且幾乎所有的算力都由矩陣計算單元提供。

8. 數據流近存計算架構：D1處理器擁有分布式SRAM，通過大量更快更近的片上存儲減少對內存的訪問頻度，提升系統性能。

9. 高帶寬和低延遲：Dojo處理器的NoC網絡可以處理跨節點邊界的數據同步，提供高帶寬和低延遲的通信。

10. 定制化架構：Dojo是一套完全可定制的架構，全面涵蓋計算、網絡、輸入/輸出（I/O）芯片。

11. 潛力巨大：據分析，Dojo有潛力為特斯拉增加巨額市值，特別是在移動和網絡服務方面的應用。