メインコンテンツへスキップ
サポート・ナレッジベース

INT8 モデルの中間表現 (IR) への変換

コンテンツタイプ: トラブルシューティング   |   記事 ID: 000058759   |   最終改訂日: 2026/03/05

詳細

モデル最適化のドキュメントでは、量子化を意識したトレーニング (QAT) について言及されています。QATを使用すると、ユーザーはOpenVINO™中間表現(IR)に変換できる正確な最適化されたモデルを取得できます。ただし、追加の詳細は提供されません。参照先:

解決方法

OpenVINO™対応トレーニングフレームワークを使用した量子化認識トレーニング (QAT) は、ニューラルネットワーク圧縮フレームワーク (NNCF) を通じて次の目的でサポートされています。

  • TensorFlow* 2 / Keras* モデル (NNCF QAT ワークフロー経由)
  • PyTorch* モデル (NNCF QAT ワークフロー経由)

NNCF は、ポストトレーニングおよびトレーニング時のモデル圧縮方法 (QAT を含む) を提供するフレームワークで、OpenVINO推論のためにモデルを最適化するために使用されます。

QAT の微調整が完了したら、最適化されたモデルを (通常は ONNX* に) エクスポートしOpenVINO™ IR に変換してデプロイできます。

メモINT8 精度への移行とそれに対応するフットプリントの利点は、モデルを OpenVINO IR に変換した後に発生します。

関連製品

本記事は、1 製品に適用します。

免責条項

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。 このページの英語版をご覧ください。