電力を考慮した Stratix 10 デバイスの設計

ID 683058
日付 6/14/2016
Public

1.1. 電力最適化の手法および推奨

電源オプションでのデバイス

パート番号にあるスピードグレードの後ろの接尾は、 Stratix® 10デバイスで提供される電源オプションです。
  • V—SmartVID
  • L—低電力 ( 固定電圧 )
  • X—超低電力 ( 固定電圧 )
L デバイスは 0.85V の固定電圧で、低スタティック電力でビニングされます。これらはスピードグレード 2 です。

X デバイスは 0.8V の固定電力で、最も低いスタティック電力でビニングされます。これらはスピードグレード 3 のデバイスです。

SmartVID デバイスは「標準」のスタティック電力です。これらはスピードグレード 1、2 および 3 のデバイスです。

SmartVID

SmartVID 機能は、電圧適応を利用してプロセス分散を狭めることで、プロセス・バリエーションを補います。一定電圧の代わりに、SmartVID 対応のデバイスは性能の目標を達成すると同時に、最適な電力を得るためにデバイスの電圧を臨機応変に調整します。節電するには、仕様を満たす要件を上回る性能のデバイスの電圧を低下させます。

SmartVID は、特定のデバイス・スピードグレードの性能を維持しながら、電源レギュレーターが Stratix® 10デバイスにより低い VCCおよび VCCP電圧レベルを供給することができます。SmartVID を使用している場合、 Stratix® 10デバイスは VCCと VCCPの両方のデフォルト電圧レベルまでパワーアップする必要があります。 Stratix® 10デバイスの VID 値が決定し、外部電圧レギュレーターに伝播された後、VCCと VCCPの両電圧は VID 値に基づいて調整されます。SmartVID 電圧は 10mV 単位で、0.8V ~ 0.94V の間で変動します。より詳しくは、 Stratix® 10 Power Management User Guideを参照してください。

DSP パワー・ゲーティング

Stratix® 10デバイスは、DSP ブロックでのスタティック・パワー・ゲーティングをサポートしているため、DSP ブロックが使用されていない場合はスタティック消費電力が削減されます。 Quartus® Prime開発ソフトウェアは、未使用の DSP ブロックでのスタティック・パワー・ゲーティングを自動的に定式化します。DSP ブロックのパワー・ゲーティングは、Configuration RAM (CRAM) ビットを介してイネーブルされます。

また、 Stratix® 10デバイスは DSP のパーシャル・リコンフィグレーションもサポートしています。 Quartus® Prime開発ソフトウェアは、パーシャル・リコンフィグレーション時に必要に応じて DSP ブロックに電源投入するビットストリームを生成します。

インテルは、内臓 DSP レジスターを使用した電力削減の最適化を可能な限り推奨しています。内蔵 DSP レジスターを使用したデザインと内蔵していない DSP レジスターを使用したさまざまな設計の調査では、50% の消費電力の削減を実現しました。

M20K パワー・ゲーティング

Stratix® 10 M20K メモリーブロックはスタティック・パワーゲートすることもできます。各メモリーアレイの半分は、それらに電源供給する PMOS スリープデバイスを介してパワーダウンすることができます。 Quartus® Prime開発ソフトウェアは、この機能により未使用のメモリーアレイへの電源供給をシャットダウンします。

Quartus® Prime開発ソフトウェアは、パーシャル・リコンフィグレーション中に必要に応じて M20K メモリーブロックをパワーアップするビットストリームを生成します。

M20K ブロックのモードはその消費電力に影響を与える場合があります。下の図で示すように、メモリーブロックの同じ番号 (8500 M20K ブロック ) とトグルレート (40%) では、消費電力はそれぞれのメモリータイプによって異なります。

図 1. 異なるコンフィグレーションでの M20K の消費電力の比較

クロック・ゲーティング

クロック・ゲーティングはダイナミック消費電力を削減することができます。アプリケーションがアイドル状態の場合、そのクロックは一時的にゲートされ、ウェイクアップ・イベントに基づいてゲートされません。各デザイン要件に応じて、非アクティブと判断された回路にクロック信号をゲートすることにより、ダイナミック消費電力の削減が実現できます。クロック・ゲーティングは、次のレベルで実行することができます。
  • Root Clock Gate

    各 I/O バンクとトランシーバー・バンクごとに 1 つのルート・クロック・ゲートがあります。このゲートはペリフェリー DCM ( 分配クロック・マルチプレクサー ) の一部であり、クロックバッファーの近くに配置されています。 Stratix® 10のルート・クロック・ゲートは高い挿入遅延が許容されるクロック・ゲーティングのシナリオが制限されていることを想定しています。ルート・クロック・ゲートをイネーブルにする際、クロックゲートの挿入と出力クロック信号の対応する変化の間にいくつかのクロックサイクルの遅延が予想されます。高いクロック周波数では、SCLK ( セクタークロック ) ゲーティングを使用してください。詳しくは、Stratix 10 Clocking and PLL User Guideを参照してください。

  • Sector Clock Gate

    すべての Stratix® 10 FPGA はセクターに分かれています。各セクターはより柔軟性を提供する独自のクロック・ネットワークを備えています。セクター・クロック・ゲーティングは SCLK マルチプレクサー・レベルで実行されます。デバイスの各セクターには、32 個の SCLK があります。各 SCLK は、クロックゲートとバイパス可能なクロックゲート・パスがあります。SCLK ゲートは、コアロジックからのクロックイネーブル入力により制御されています。 Quartus® Prime開発ソフトウェアはセクター内の 32 個の SCLK に最大 8 個の異なるクロックイネーブル信号を配線することができます。セクターの SCLK ネットワーク内に入るクロック信号は、そのセクター内のコアロジックにしか到達できません。

    デザインで SCLK ゲートをインスタンス化すると、 Quartus® Prime開発ソフトウェアは SCLK ゲートを自動的に複製し、クロック信号が配線されるすべてのセクターにクロックゲートを作成します。SCLK ゲートは高いクロック周波数用のサイクル固有のクロック・ゲーティングに適しています。SCLK ゲートへのパスのタイミングは、 Quartus® Prime開発ソフトウェアにより分析されます。

  • I/O PLL Clock Gate

    Stratix® 10の I/O PLL の各出力カウンターは動的にゲートすることができます。これにより、ルートクロックは 9 つの出力カウンターのうちの 1 つだけをゲートすることができ、代わりの手段として役立つルート・クロック・ゲートを提供します。

    ただし、I/O PLL クロックゲートはサイクル固有ではありません。I/O PLL クロックゲートを使用している間、クロックゲートのアサーションまたはディアサーションと対応するクロック信号の変化との間にいくつかのクロックサイクルの遅延が予想されます。イネーブルされた信号が出力クロックのクロックドメインに同期されなければならないため、遅延サイクル数は非確定的です。これによりグリッチのないゲートが保証されます。より詳しくは、Stratix 10 Clocking and PLL User Guideを参照してくださ。

トランシーバー使用中の電力削減

Stratix® 10デバイスは、高い電力効率、広い帯域幅、低遅延トランシーバーの特徴があります。最適なスタティック電力およびダイナミック電力の削減では、インテルはそれぞれのデータレートとプロトコル要件をサポートする最も低いトランシーバー電圧 (VCCR / T_GXB) の使用を推奨しています。