ハードウェア

TPU(テンソル・プロセッシング・ユニット)

TPU は機械学習を高速化するためにGoogleが独自開発したASICチップで、ニューラルネットワークの行列演算に最適化されている。

TPUTensor Processing Unit、テンソル・プロセッシング・ユニット)は、機械学習のワークロードを高速化するためにGoogleが専用に開発した特定用途向け集積回路(ASIC)である。汎用の GPU とは異なり、TPU はニューラルネットワーク演算の中核をなす大規模な行列演算のためだけに設計されている。

そのアーキテクチャは、処理素子を格子状に並べたシストリックアレイ(systolic array)を中心とし、低精度(例えば8ビット、新世代ではFP4/BF16)で行列乗算を実行することで、高いスループットと優れた電力効率を実現する。Googleは2015年から社内でTPUを利用し、2018年にはGoogle Cloudを通じて外部の利用者にも提供を開始した。チップはBroadcomと共同設計され、TSMCが製造している。

TPU はGoogleのAIインフラの中核であり、Geminiシリーズなどのモデルの学習と推論の両方を支えている。Trillium(v6)、Ironwood(v7)、そして2026年に予告された学習用と推論用を分離した派生品など、最新世代はTPUを、ディープラーニングにおけるNvidiaのGPU優位に対するGoogleの主力として位置づけ続けている。

出典

関連項目