メインコンテンツへスキップ
サポート・ナレッジベース

CPU よりも GPU へのモデルロード時間が長いのはなぜですか?

コンテンツタイプ: メンテナンス & パフォーマンス   |   記事 ID: 000057525   |   最終改訂日: 2026/03/05

環境

OpenVINO™ツールキット GPU プラグイン CPU プラグイン

詳細

入力モデルの中間表現 (IR) の GPU への読み込みは、同じモデルを CPU に読み込むよりも時間がかかります。

解決方法

アプリケーションの作業ディレクトリにcl_cacheディレクトリを手動で作成します

ドライバーはこのディレクトリーを使用して、コンパイルされたカーネルのバイナリー表現を格納します。これは、サポートされているすべてのOSで動作します。

または、環境変数を設定します。

export INTEL_OPENCL_CACHE=1

追加情報

レイテンシーを最適化するには、モデルキャッシュの概要に関するこちらの記事を参照してください

GPU スタックは OpenCL* に基づいているため、中間表現 (IR) 形式の入力モデルを GPU にロードする方が、同じモデルを CPU にロードするよりも時間がかかります。ロード時間は、OpenCL* カーネルのコンパイル時間に依存します。

cl_cacheを有効にしても、OpenCL* カーネルがコンパイルされるため、モデルを初めてロードするときは時間がかかります。ただし、同じモデルの後続の各ロードははるかに高速になります。

OpenVINO™ 2026.0 のプログラムによるキャッシュ構成の場合:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

関連情報

OpenVINO™ 2026.0 GPU プラグインのドキュメント

関連製品

本記事は、1 製品に適用します。

免責条項

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。 このページの英語版をご覧ください。