TPU
TPU(Tensor Processing Unit)は、Googleが開発した機械学習に特化した特定用途向け集積回路(ASIC)です。この技術は、TensorFlowというGoogleのオープンソース機械学習フレームワークと密接に統合されており、クラウド上でのディープラーニングサービス、Cloud TPUとして提供されています。
TPUは、スカラープロセッサ、ベクトルプロセッサ、およびMXU(Matrix Unit)という3種類の処理ユニットを持つ各コアから構成されています。MXUは、16,000回の累積乗算操作をサイクルごとに実行する能力を持ち、機械学習モデル計算のための精度向上に寄与するbfloat16という16ビットの浮動小数点表現を使用します。このような特性は、TPUを行列計算を主とする機械学習モデルに特に適しています。
TPUの進化は、初代から始まり、現在は第五世代に至っています。初代TPUは8ビットの行列乗算エンジンであり、28nmプロセスで製造され、28MiBのオンチップメモリを備えています。第二世代TPUは、メモリ帯域幅と性能を大幅に向上させ、機械学習モデルのトレーニングと推論の両方に使用可能です。第三世代は、第二世代よりも処理能力が2倍になり、より多くのチップを搭載したポッドに展開されています。第四世代TPUは、第三世代と比較して2倍以上のマトリックス乗算能力を提供し、メモリ帯域幅と相互接続技術が大幅に改善されています。第五世代TPUは、TPU v4と同等世代とみなされており、物理的なレイアウトに深層強化学習を応用しています。
また、Googleは2018年にEdge TPUを発表しました。これは、エッジコンピューティング用に特別に設計された小型で低消費電力のASICチップです。Edge TPUは、4兆回の操作を毎秒2Wの電力で実行する能力を持っており、8ビット数学のみをサポートします。Edge TPUは、Coralブランドの製品ラインで開発者に提供されています。
