メインコンテンツへスキップ
サポート・ナレッジベース

最適なインテル® / ニューラルネットワーク圧縮フレームワーク (NNCF) を使用した重み圧縮で FP16 モデルを選択する理由

コンテンツタイプ: トラブルシューティング   |   記事 ID: 000098174   |   最終改訂日: 2024/03/21

詳細

最適なインテル / NNCF を使用した重量圧縮で FP16 モデルを選択する理由を特定できません。

解決方法

FP32 の精度のモデルサイズを半分にする FP16 の半精度は、GPU リソースの半分を使用しながら、ほぼ同じ推論結果を得ることができます。

関連製品

本記事は、3 製品に適用します。
インテル® Xeon Phi™ プロセッサー・ソフトウェア OpenVINO™ toolkit パフォーマンス・ライブラリー

免責条項

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。 このページの英語版をご覧ください。