INT8 モデルの中間表現 (IR) への変換
コンテンツタイプ: トラブルシューティング | 記事 ID: 000058759 | 最終改訂日: 2026/03/05
モデル最適化のドキュメントでは、量子化を意識したトレーニング (QAT) について言及されています。QATを使用すると、ユーザーはOpenVINO™中間表現(IR)に変換できる正確な最適化されたモデルを取得できます。ただし、追加の詳細は提供されません。参照先:
OpenVINO™対応トレーニングフレームワークを使用した量子化認識トレーニング (QAT) は、ニューラルネットワーク圧縮フレームワーク (NNCF) を通じて次の目的でサポートされています。
NNCF は、ポストトレーニングおよびトレーニング時のモデル圧縮方法 (QAT を含む) を提供するフレームワークで、OpenVINO推論のためにモデルを最適化するために使用されます。
QAT の微調整が完了したら、最適化されたモデルを (通常は ONNX* に) エクスポートしOpenVINO™ IR に変換してデプロイできます。
| メモ | INT8 精度への移行とそれに対応するフットプリントの利点は、モデルを OpenVINO IR に変換した後に発生します。 |