FPGA AI スイート
FPGA AI スイートにより、FPGA 設計者、機械学習エンジニア、ソフトウェア開発者は最適化した FPGA AI プラットフォームを効率的に作成することができます。このスイート内のユーティリティーは、TensorFlow や PyTorch、OpenVINO ツールキットなど、業界でよく使用されているフレームワークを使用して、AI 推論用の FPGA 開発を高速化します。また、Quartus Prime 開発ソフトウェアでは、堅牢かつ実績のある FPGA 開発フローも利用できます。
FPGA AI スイート
利点
高性能
Agilex™ 7 FPGA M シリーズは、90% の FPGA 使用率で 88.5 INT8 TOPS、または 3,679 Resnet-50 フレーム/秒という理論上の最大パフォーマンスを実現します。<1>
簡単なシステム統合で総所有コスト (TCO) の削減
AI IP と他のシステムレベルのコンポーネントを統合し、フットプリントの小型化、低消費電力、レイテンシーを実現します。
AI フロントエンドのサポート
TensorFlow、Caffe、Pytorch、MXNet、Keras、ONNX などの AI フロントエンドを使用します。
シンプルでスタンダードな流れ
Quartus® Prime 開発ソフトウェア、またはプラットフォーム・デザイナーを使用すると、現在または新しい FPGA デザインに AI 推論 IP を作成して追加できます。
トレーニング済みモデルへのアクセス
FPGA AI スイートは、Open Model Zoo のほとんどのモデルをサポートします。
シームレスなトレーニング済みモデルの変換
OpenVINO™ ツールキットは、ほとんどの標準フレームワークから中間表現にモデルを変換します。
ボタンを押すだけで最適化された AI IP を生成
FPGA AI スイートは、最適なリソースからパフォーマンス目標までのデザインスペースを網羅するトレーニング済みの AI モデルから、最適な AI 推論 IP をシームレスに生成します。
ハードウェア不要の初期モデルの検証
OpenVINO™ プラグイン・インターフェイスを通じて、AI 推論 IP のビット精度1のソフトウェア・エミュレーションが利用可能になり、ハードウェアなしでモデルの精度を迅速に評価できます。
FPGA による AI 推論開発フロー
この開発フローでは、ハードウェアとソフトウェアのワークフローをエンドツーエンドの汎用 AI ワークフローにシームレスに組み合わせています。手順は次のとおりです。
1.OpenVINO™ モデル・オプティマイザーは、トレーニング済みモデルを中間表現のネットワーク・ファイル (.xml) と重み、バイアス・ファイル (.bin) に変換します。
2.インテル® FPGA AI スイートのコンパイラーは、以下のように使用されます。
- 指定のアーキテクチャー・ファイルの推定領域またはパフォーマンス指標を提供するか、最適化したアーキテクチャー・ファイルを作成します。(アーキテクチャーとは、PE アレイのサイズ、精度、アクティベーション機能、インターフェイスの幅、ウィンドウのサイズなど推論 IP パラメーターのことを指します。)
- ネットワーク・ファイルを .bin ファイルにコンパイルし、FPGA と CPU (またはその両方) のネットワーク・パーティションと、重みとバイアスを設定します。
3.コンパイル済みの .bin ファイルは、実行中にユーザー推論アプリケーションでインポートされます。
- ランタイム・アプリケーション・プログラミング・インターフェイス (API) は、推論エンジン API (ランタイム・パーティション CPU と FPGA、スケジュール推論) と FPGA AI (DDR メモリー、FPGA ハードウェア・ブロック) が含まれています。
4.リファレンス・デザインは、ホストレス推論操作をサポートする、ホスト・プロセッサー (x86 および Arm プロセッサー) と、FPGA 上での .bin のインポートと推論の実行に関する基本的な操作を実証するために利用できます。
5.FPGA AI スイート IP のソフトウェア・エミュレーションは、OpenVINO™ プラグイン・インターフェイスを通じてアクセス可能であり、ハードウェアにアクセスすることなく、FPGA AI IP の精度を迅速に評価できます (Agilex™ 5 FPGA でのみ利用可能)。
注:
サポートされているデバイス: Agilex™ 5 FPGA、Agilex™ 7 FPGA、Cyclone® 10 GX FPGA、Arria® 10 FPGA
テスト済みのネットワーク、レイヤー、アクティベーション機能2:
- ResNet-50、MobileNet v1/v2/v3、YOLO v3、TinyYOLO v3、UNET、i3d
- 2D Conv、3D Conv、完全接続、Softmax、BatchNorm、EltWise Mult、クランプ
- ReLU、PReLU、Tanh、Swish、Sigmoid、Reciprocal
システムレベルのアーキテクチャー
FPGA AI スイートは、さまざまなシステムレベルの使用事例に対して、柔軟性に優れ、構成可能です。図 1. FPGA AI スイートの IP をシステムに組み込む一般的な方法を一覧表示します。このユースケースは、最適化されたエンベデッド・プラットフォームから、ホスト CPU (インテル® Core™ プロセッサー、Arm プロセッサー) 搭載のアプリケーション、インテル® Xeon® プロセッサー搭載データセンター環境まで、さまざまな分野にわたります。ホストレス・デザインと Nios® V プロセッサーなどのソフト・プロセッサーをサポートします。
FPGA AI デザインのガイド付きジャーニー
インタラクティブな FPGA AI デザインのガイド付きジャーニーについて詳しく説明します。AI Intellectual Property (IP) のデザイン開発のための順を追ったガイダンスを提供します。
設計を始める
FPGAi について詳しく知る
FPGAi のリソース、ホワイトペーパー、成功事例を参照
詳細を見る
FPGA が AI の実装に特に優れている理由は何ですか?
エッジおよびカスタム AI アプリケーションにおける FPGA ベースの AI 推論、およびエッジ FPGA AI 向けのソフトウェアおよびハードウェア・ソリューションの新たなユースケースについてご覧ください。
ホワイトペーパーを読む
免責事項
ソフトウェア・エミュレーションとハードウェア間のわずかな丸め誤差は、通常、ULP (units of least precision) が 2 未満の誤差となります。