記事 ID: 000057525 コンテンツタイプ: メンテナンス & パフォーマンス 最終改訂日: 2023/01/31

モデルの GPU への読み込み時間が CPU よりも長いのはなぜですか?

環境

OpenVINO™・ツールキット GPU プラグイン CPU プラグイン

BUILT IN - ARTICLE INTRO SECOND COMPONENT
概要

GPU のモデル読み込み時間を改善するクイックステップ

詳細

入力モデルの中間表現 (IR) を GPU に読み込むには、CPU に同じモデルを読み込むよりも長い時間がかかります。

解決方法

アプリケーションの作業ディレクトリーに、cl_cache・ディレクトリーを手動で作成します。

ドライバーは、コンパイルされたカーネルのバイナリ表現を格納するために、このディレクトリを使用します。これは、サポートされているすべての OS で動作します。

追加情報

cl_cacheの管理に関する詳細については、この 記事を参照してください

GPU スタックは OpenCL* をベースにしているため、GPU に対する中間表現 (IR) 形式の入力モデルの読み込みは、同じモデルを CPU に読み込むよりも長くなります。読み込み時間は、OpenCL* カーネルのコンパイル時間によって異なります。

cl_cacheを有効にすると、OpenCL* カーネルがコンパイルされるため、初めてモデルを読み込むには時間がかかります。ただし、同じモデルの後続の読み込みはそれぞれはるかに速くなります。

このページのコンテンツは、元の英語のコンテンツを人力翻訳および機械翻訳したものが混在しています。この内容は参考情報および一般的な情報を提供するためものであり、情報の正確さと完全性を保証するものではありません。インテルは不正確な翻訳があった場合でもいかなる責任を負いません。このページの英語版と翻訳の間に矛盾がある場合は、英語版に準拠します。 このページの英語版をご覧ください。