電力を考慮した Stratix 10 デバイスの設計
電力を考慮した Stratix 10 デバイスの設計
さらに、 Stratix® 10デバイスは、業界をリードするインテルの 14 nm プロセスの Tri-Gate ( トライゲート ) で開発された唯一の高性能 FPGA およびプログラマブルな SoC であり、前世代と比較して最大 70% の消費電力の低減を実現します。
このアプリケーション・ノートは、 Stratix® 10 FPGA でデザインをする際に実装できる電力最適化ストラテジーに重点を置いて説明しています。また、さまざまな設計シナリオで使用されるリソースでの消費電力の統計も紹介しています。
電力最適化の手法および推奨
電源オプションでのデバイス
- V—SmartVID
- L—低電力 ( 固定電圧 )
- X—超低電力 ( 固定電圧 )
X デバイスは 0.8V の固定電力で、最も低いスタティック電力でビニングされます。これらはスピードグレード 3 のデバイスです。
SmartVID デバイスは「標準」のスタティック電力です。これらはスピードグレード 1、2 および 3 のデバイスです。
SmartVID
SmartVID 機能は、電圧適応を利用してプロセス分散を狭めることで、プロセス・バリエーションを補います。一定電圧の代わりに、SmartVID 対応のデバイスは性能の目標を達成すると同時に、最適な電力を得るためにデバイスの電圧を臨機応変に調整します。節電するには、仕様を満たす要件を上回る性能のデバイスの電圧を低下させます。
SmartVID は、特定のデバイス・スピードグレードの性能を維持しながら、電源レギュレーターが Stratix® 10デバイスにより低い VCCおよび VCCP電圧レベルを供給することができます。SmartVID を使用している場合、 Stratix® 10デバイスは VCCと VCCPの両方のデフォルト電圧レベルまでパワーアップする必要があります。 Stratix® 10デバイスの VID 値が決定し、外部電圧レギュレーターに伝播された後、VCCと VCCPの両電圧は VID 値に基づいて調整されます。SmartVID 電圧は 10mV 単位で、0.8V ~ 0.94V の間で変動します。より詳しくは、 Stratix® 10 Power Management User Guideを参照してください。
DSP パワー・ゲーティング
Stratix® 10デバイスは、DSP ブロックでのスタティック・パワー・ゲーティングをサポートしているため、DSP ブロックが使用されていない場合はスタティック消費電力が削減されます。 Quartus® Prime開発ソフトウェアは、未使用の DSP ブロックでのスタティック・パワー・ゲーティングを自動的に定式化します。DSP ブロックのパワー・ゲーティングは、Configuration RAM (CRAM) ビットを介してイネーブルされます。
また、 Stratix® 10デバイスは DSP のパーシャル・リコンフィグレーションもサポートしています。 Quartus® Prime開発ソフトウェアは、パーシャル・リコンフィグレーション時に必要に応じて DSP ブロックに電源投入するビットストリームを生成します。
アルテラは、内臓 DSP レジスターを使用した電力削減の最適化を可能な限り推奨しています。内蔵 DSP レジスターを使用したデザインと内蔵していない DSP レジスターを使用したさまざまな設計の調査では、50% の消費電力の削減を実現しました。
M20K パワー・ゲーティング
Stratix® 10 M20K メモリーブロックはスタティック・パワーゲートすることもできます。各メモリーアレイの半分は、それらに電源供給する PMOS スリープデバイスを介してパワーダウンすることができます。 Quartus® Prime開発ソフトウェアは、この機能により未使用のメモリーアレイへの電源供給をシャットダウンします。
Quartus® Prime開発ソフトウェアは、パーシャル・リコンフィグレーション中に必要に応じて M20K メモリーブロックをパワーアップするビットストリームを生成します。
M20K ブロックのモードはその消費電力に影響を与える場合があります。下の図で示すように、メモリーブロックの同じ番号 (8500 M20K ブロック ) とトグルレート (40%) では、消費電力はそれぞれのメモリータイプによって異なります。
クロック・ゲーティング
-
Root Clock Gate
各 I/O バンクとトランシーバー・バンクごとに 1 つのルート・クロック・ゲートがあります。このゲートはペリフェリー DCM ( 分配クロック・マルチプレクサー ) の一部であり、クロックバッファーの近くに配置されています。 Stratix® 10のルート・クロック・ゲートは高い挿入遅延が許容されるクロック・ゲーティングのシナリオが制限されていることを想定しています。ルート・クロック・ゲートをイネーブルにする際、クロックゲートの挿入と出力クロック信号の対応する変化の間にいくつかのクロックサイクルの遅延が予想されます。高いクロック周波数では、SCLK ( セクタークロック ) ゲーティングを使用してください。詳しくは、Stratix 10 Clocking and PLL User Guideを参照してください。
-
Sector Clock Gate
すべての Stratix® 10 FPGA はセクターに分かれています。各セクターはより柔軟性を提供する独自のクロック・ネットワークを備えています。セクター・クロック・ゲーティングは SCLK マルチプレクサー・レベルで実行されます。デバイスの各セクターには、32 個の SCLK があります。各 SCLK は、クロックゲートとバイパス可能なクロックゲート・パスがあります。SCLK ゲートは、コアロジックからのクロックイネーブル入力により制御されています。 Quartus® Prime開発ソフトウェアはセクター内の 32 個の SCLK に最大 8 個の異なるクロックイネーブル信号を配線することができます。セクターの SCLK ネットワーク内に入るクロック信号は、そのセクター内のコアロジックにしか到達できません。
デザインで SCLK ゲートをインスタンス化すると、 Quartus® Prime開発ソフトウェアは SCLK ゲートを自動的に複製し、クロック信号が配線されるすべてのセクターにクロックゲートを作成します。SCLK ゲートは高いクロック周波数用のサイクル固有のクロック・ゲーティングに適しています。SCLK ゲートへのパスのタイミングは、 Quartus® Prime開発ソフトウェアにより分析されます。
-
I/O PLL Clock Gate
Stratix® 10の I/O PLL の各出力カウンターは動的にゲートすることができます。これにより、ルートクロックは 9 つの出力カウンターのうちの 1 つだけをゲートすることができ、代わりの手段として役立つルート・クロック・ゲートを提供します。
ただし、I/O PLL クロックゲートはサイクル固有ではありません。I/O PLL クロックゲートを使用している間、クロックゲートのアサーションまたはディアサーションと対応するクロック信号の変化との間にいくつかのクロックサイクルの遅延が予想されます。イネーブルされた信号が出力クロックのクロックドメインに同期されなければならないため、遅延サイクル数は非確定的です。これによりグリッチのないゲートが保証されます。より詳しくは、Stratix 10 Clocking and PLL User Guideを参照してくださ。
トランシーバー使用中の電力削減
Stratix® 10デバイスは、高い電力効率、広い帯域幅、低遅延トランシーバーの特徴があります。最適なスタティック電力およびダイナミック電力の削減では、アルテラはそれぞれのデータレートとプロトコル要件をサポートする最も低いトランシーバー電圧 (VCCR / T_GXB) の使用を推奨しています。
リソース使用率での電力見積もり
- デバイス—F43 パッケージでの SG280
- デバイスタイプ—X
- ジャンクション温度
リソース・コンフィグレーション | スタティック電力 1 | ダイナミック電力 | |
---|---|---|---|
低使用率 ~
50%
800K 半分-ALM |
高使用率 ~
90%
1.7M 半分-ALM |
||
低速コンフィグレーション :
|
なし | 18 W | 40 W |
高速コンフィグレーション :
|
なし | 27 W | 56 W |
リソース・コンフィグレーション | スタティック電力 | ダイナミック電力 | |
---|---|---|---|
低使用率 ~
40%
4600 メモリーブロック |
高使用率 ~
70%
8500 メモリーブロック |
||
低速コンフィグレーション :
|
2 W | 3.7 W | 7 W |
高速コンフィグレーション :
|
2 W | 16.5 W | 30 W |
リソース・コンフィグレーション | スタティック電力 | ダイナミック電力 | |
---|---|---|---|
低使用率 ~
40%
2300 DSP ブロック |
高使用率 ~
70%
4000 DSP ブロック |
||
低速コンフィグレーション :
|
2.5/4 W | 5 W | 8.6 W |
高速コンフィグレーション :
|
2.5/4 W | 40 W | 66 W |
リソース・コンフィグレーション | スタティック電力 | ダイナミック電力 | |
---|---|---|---|
低使用率
16 チャネル |
高使用率
96 チャネル |
||
低速コンフィグレーション :
|
2 W | 5 W | 40 W |
高速コンフィグレーション :
|
2 W | 7 W | 45 W |
リソース・コンフィグレーション | スタティック電力 | ダイナミック電力 | |
---|---|---|---|
低使用率 ~ 50% | 高使用率 ~ 90% | ||
低速コンフィグレーション :
|
1 W | 3 W | 6 W |
高速コンフィグレーション :
|
1 W | 7 W | 13.5 W |
Stratix® 10デバイスは、前世代の FPGA デバイスよりも集積度と性能が大幅に向上し、高速です。これに対応して、電力効率の向上にもかかわらず消費電力が増加します。したがって、このアプリケーション・ノートの電力削減機能を活用し、 Stratix® 10 FPGA デザインでの消費電力の熱 Stratix® 10影響を計画する必要があります。 Stratix® 10デバイスの熱ソリューションについて詳しくは、アルテラのサポートチームにお問い合わせください。
改訂履歴
日付 | 変更内容 |
---|---|
2016.06.14 | 初版 |