熟した実をつけたトマトの横で、トマトを摘んでいるロボットハンドのクローズアップ写真。黄色いボックスの周囲に「Ripe Tomato (熟したトマト)」の文字と熟度の % 値が表示されていて、コンピューター・ビジョンの活用例を示しています

コンピューター・ビジョンの概要

コンピューター・ビジョンは人工知能 (AI) を使用し、ビジュアルデータを認識して解釈することにより、プロセスの改善、プロアクティブで迅速な状況への対応を可能にし、ビジネスと顧客価値の向上を実現します。

コンピューター・ビジョンの重要ポイント

  • コンピューター・ビジョンは、コンピューターとシステムが、画像と映像データから得られるインサイトに基づいて動作することを可能にする、AI の一種です。

  • コンピューター・ビジョンは、エッジ・コンピューティング、クラウド・コンピューティング、ソフトウェア、AI ディープラーニング・モデルを組み合わせて、収集したビジュアルデータを認識、分類、分析し、アクションを実行します。

  • 組織は、コンピューター・ビジョンをさまざまなユースケースに適用し、オートメーション、効率化、価値の向上を実現しています。

author-image

投稿者:

コンピューター・ビジョンの概要

コンピューター・ビジョンは、人間が見る方法を模倣し、見たものを理解し、処理・分析された情報に基づいて動作するように、コンピューターを訓練する AI の一種です。コンピューター・ビジョンを使用する組織は、プロセスの合理化、パフォーマンスの向上、顧客体験の向上、差別化による市場での競争力の強化など、さまざまなビジネス上の成果を達成できます。

コンピューター・ビジョンは、欠陥や異常の識別と分類、機械の状態監視、自動医用画像分析、疾病検出など、時間がかかり、エラーが発生しやすく、人間にはほぼ不可能な作業によく使用されます。このような種類の作業では、組織が複数のタッチポイントから運用、プロセス、またはその他の部分の業務を監視することを必要とし、そこから生成される膨大な量のビジュアルデータから、多くの場合リアルタイムに近い速度でインサイトを抽出し、何らかの対応を行う必要があります。

コンピューター・ビジョンの使用方法

コンピューター・ビジョン・システムは、マシンラーニングとディープラーニング・モデルを使用して、システムで画像や映像のさまざまな側面を認識し、それらに関する予測を行います。コンピューター・ビジョン・モデルには、次の種類があります。

 

  • 画像分類: 画像を検査して、その内容に基づいてクラスラベルを割り当てます。例えば、画像分類モデルを使用して、どの画像に犬、猫、怒っている顧客が含まれているかを予測することができます。
  • 画像セグメンテーション: X 線検査で周囲の脳組織から腫瘍を判別するなど、物体を識別して背景から抽出します。
  • 物体検出: 画像や動画をスキャンして対象物を見つけます。物体検出モデルは、一般的に複数の物体を同時に強調表示します。在庫管理を改善するため棚にある商品を識別したり、生産ライン上のアイテムの異常を識別したりといったタスクに使用できます。
  • 物体追跡: 検出された物体が、ある環境内を移動する際に、その動きを追跡します。例えば、物体追跡を自動運転車両で、歩道や道路を横切る歩行者の動きを追跡する目的で使用できます。
  • 特徴抽出: 画像や動画でキャプチャーされた有用な特徴を分離し、検索や画像マッチングなど、2 番目の AI アルゴリズムでそれらの特徴を共有します。例えば、特徴抽出は、交通監視や事故検知を自動化するために使用できます。
  • 光学式文字認識: 画像から文字を抽出し、機械が読み取れる形式に変換します。これは、銀行業務や医療現場で、重要な書類や患者の記録を処理するために、よく使用されます。

多様な業界におけるコンピューター・ビジョンの応用

コンピューター・ビジョンは、広範囲にわたる新しいユースケースを可能にし、運用コストの削減、ビジネス・オートメーションの実現、新しいサービスや収益源の創出など、あらゆる業界の企業における実環境の課題を解決するのに役立っています。コンピューター・ビジョンを採用している主な業界と、このテクノロジーを応用した画期的な方法をいくつか紹介します。

産業用オートメーションと製造

製造メーカーは、製造工程の効率化、人為的エラーの削減、作業員の安全性の向上、低コストでの生産量増加などに役立つ自動化を実現するために、コンピューター・ビジョンを使用しています。製造業におけるコンピューター・ビジョンの一般的な応用方法には、以下のようなものがあります。

 

  • 製品検査の自動化: 目視による製品の検査は品質管理に欠かせません。生産ラインのカメラ、欠陥分類と異常検出のための AI モデル、エッジ・コンピューティングを使用した光学検査の自動化により、製造メーカーは品質保証の精度とスピードを向上できます。
  • 安全監視: コンピューター・ビジョンは、作業員の安全確保を目的とした工場フロアの監視にも使用できます。例えば、リアルタイムのビデオ映像を分析することで、事故や流出を特定してスタッフに警告したり、制限された危険エリアへの進入を検出したりすることができます。

ヘルスケア

予防医療から、がん治療の計画まで、コンピューター・ビジョンは、患者の転帰の改善、精度の向上、疾患検出の迅速化などを支援するために、さまざまな方法で医療機関に採用されています。ヘルスケアにおけるコンピューター・ビジョンの応用例には、以下のようなものが挙げられます。

 

  • 医用画像処理: CT スキャナー、X 線システム、内視鏡カメラ、その他の医用画像処理テクノロジーにコンピューター・ビジョン・システムを搭載することで、膨大な量のデータの迅速な処理、ワークフローの効率化、正確かつ効率的な画像診断が可能になります。ディープラーニング・テクノロジーは、デジタル病理検査におけるスライド画像全体の支援にも応用されています。
  • 遠隔患者モニタリング: コンピューター・ビジョン・アプリケーションを搭載したカメラとセンサーを使用し、ゲートや体位などの患者の動きに関するデータを収集して分析することで、確立された規範からの逸脱を特定し、医療チームに対して緊急の必要性に関してアラートを発することができます。

小売

コンピューター・ビジョンは、商品の陳列場所の把握から在庫補充の最適なタイミング、店舗内の顧客行動の追跡まで、小売業者がその業務に関する強力なインサイトを発見し、より多くの情報に基づいたビジネス上の意思決定を行うのに役立ちます。小売業におけるコンピューター・ビジョンの応用方法には、以下のようなものがあります。

 

  • 損失防止: コンピューター・ビジョン・モデルは、既存の店舗内カメラやセルフチェック・キオスクからのデータを解析し、不審な行動を特定し、管理者にリアルタイムでアラートを送信して、不正行為の発生を阻止するのに役立ちます。
  • タッチレス・セルフサービス・チェックアウト端末: 効率を高めて顧客体験を向上させたいと望んでいる小売業者は、3D スマート・スキャン・テクノロジーとコンピューター・ビジョン・モデルを活用することで、バーコードのない食品をキャプチャー、検出、認識し、スタッフの介入を最小限に抑えながら迅速で便利なチェックアウトを実現しています。

スマートシティー

スマートシティー・テクノロジーでは、路上に設置されたカメラのビデオ映像フィードを収集し、その都市の指導者が市民の安全性、移動の利便性、生活の質を向上させるために、より多くの情報に基づいた運用上の判断を下すことができるようになります。スマートシティーにおけるコンピューター・ビジョンの応用方法の例をいくつか紹介します。

 

  • 交通管理: 市役所では、コンピューター・ビジョン・システムを導入して道路の交差点や交通パターンを監視および分析するだけでなく、車両や歩行者を検出および追跡して交通の流れを最適化し、交差点における安全性を高めることができます。
  • インフラ保守: コンピューター・ビジョン・モデルを適切にトレーニングすると、市全域や郡全域の道路や橋の穴あきや舗装のひび割れの問題を認識し、保守が必要な場所を作業員に知らせることができます。

コンピューター・ビジョンの仕組み

コンピューター・ビジョンは、エッジ・コンピューティング、クラウド・コンピューティング、ソフトウェア、AI ディープラーニング・モデルなどのコンポーネントを組み合わせることで、コンピューターがカメラやビデオから収集したデータを「見て」、特定の物体、人、パターンを迅速に認識し、それらについて予測を行い、必要に応じて行動を起こすことを可能にします。

畳み込みニューラル・ネットワークの役割

コンピューター・ビジョン・システムは、畳み込みニューラル・ネットワーク (CNN) と呼ばれるアルゴリズム・ファミリーのディープラーニング・モデルを使用して、画像処理と分析を導きます。これらのディープラーニング・モデルは、デジタル画像のピクセルに埋め込まれた RGB 値を分析し、識別可能なパターンを検出します。CNN は、色分布、形状、テクスチャー、深度など、幅広い特徴に基づいてピクセルを評価し、オブジェクトを正確に認識・分類するために開発することが可能です。

コンピューター・ビジョン・モデルのトレーニング

コンピューター・ビジョン・システムを業務に活用する前に、データ・サイエンティストや開発者は、その特定のユースケースに合わせてシステムのディープラーニング・モデルをトレーニングする必要があります。これには、モデルが識別するよう開発されている対象を認識するために、そのモデルが使用できるアプリケーション固有データを大量に入力することが必要になります。例えば、犬を認識するために設計されたコンピューター・ビジョンのアプリケーションの場合、モデルはまず犬がどのように見えるかを学習する必要があります。この学習は、さまざまな犬種、大きさ、色、特徴を持つ犬の数千万~数百万枚の画像でトレーニングすることで実現します。

一般的に、トレーニングはデータセンターやクラウド環境で実施されます。特に複雑なトレーニングの取り組みでは、GPU と AI アクセラレーターを利用することで、プロセスを迅速化し、関連するパラメーター数の増加をより適切に処理できます。モデルのトレーニング段階が完了すると、デジタル画像から情報を解釈し、推論するために必要な知識が得られます。時間の経過に伴って、モデルに対して追加の微調整や再トレーニングが行われる場合もあります。

また、コンピューター・ビジョン・ソリューションを構築する場合、既製の基礎モデルを微調整の出発点として使用することで、開発期間を短縮し、ゼロからのスタートを避けることができます。

コンピューター・ビジョン・モデルを導入する

学習が完了したコンピューター・ビジョン・モデルは、コンピューター・システムに導入され、推論を実行し、現場の状況を解釈することができます。画像とビデオデータを継続的に評価して、インサイトと情報を抽出します。コンピューター・ビジョン・ソリューションは、クラウドやデータセンターで推論ワークロードを実行できますが、今日、多くの組織ではエッジ AI アプリケーションを模索しています。軽量で最適化されたエッジ・ハードウェアまたは組込みデバイスでデータが生成され、コンピューター・ビジョンのモデルを現場に近いところで実行する方法です。
AI 推論機能をエッジの近くに動かすことで、主に以下のような利点があります。

 

  • 速度の向上とレイテンシーの低減: データの処理と分析を、データが生成される場所へ移動させることで、システムの応答が高速化し、多くのコンピューター・ビジョン・アプリケーションに不可欠な、トランザクションの高速化と体験の向上が実現します。
  • ネットワーク・トラフィック管理の改善: ネットワーク経由でクラウドに送信されるデータの量を最小限に抑えることで、大量のデータの転送と保存に必要な帯域幅とコストを削減できます。
  • 信頼性の向上: ネットワークが同時に転送できるデータの量には、制限があります。インターネット接続が弱い地域では、エッジでデータを保存・処理することで、信頼性が向上します。
  • セキュリティーの強化: 適切な実装により、エッジ・コンピューティング・ソリューションは、インターネット上のデータ転送を制限することでデータ・セキュリティーを向上できます。
  • プライバシー・コンプライアンスの要件: 政府、顧客、業界によっては、コンピューター・ビジョンのアプリケーションで使用されているデータを、そのデータが生成された管轄区域内に留めることを要求する場合があります。エッジ・コンピューティングは、企業がそのようなルールと規制を遵守し続けるのに役立ちます。

コンピューター・ビジョンの利用を開始する

コンピューター・ビジョンは、ほかの形態の AI と同様に、ビジネスのあらゆる側面に影響を及ぼしています。運用コストの削減、ビジネス・オートメーションの実現、潜在的な新サービスや収益源の特定などで、幅広い業界の企業に役立っています。コンピューター・ビジョンのパワーを活用し、新たなユースケース、機能、イノベーションを生み出せる企業は、今後業界のリーダーとして台頭してくるでしょう。
お客様のビジネスがコンピューター・ビジョンの AI ジャーニーを推進するにあたり、インテルは、お客様の AI イニシアチブの成功を支援する準備ができています。

インテルのハードウェアとソフトウェアで最適化された、スケーラブルで、すぐに導入できる AI ソリューションを見つけてください

よくある質問 (FAQ)

よくある質問

コンピューター・ビジョンは、コンピューターが画像や映像から収集されたデータを「見る」ことを可能にする AI の一種です。コンピューター・ビジョン・システムは、ロボット、スマートシティー、製造、ヘルスケア、小売店など、幅広い環境と業界で使用されています。

コンピューター・ビジョンは、カメラ、エッジ・コンピューティング、クラウドベースのコンピューティング、ソフトウェア、AI モデルを併用し、システムが物体を「見て」特定するためのものです。ディープラーニングを使用して、システムの画像処理と分析を導くニューラル・ネットワークを形成することで、コンピューターに画像やビデオのさまざまな側面を認識させ、それらに関する予測を行えるよう学習させることができます。

畳み込みニューラル・ネットワーク (CNN) の手法により、画像の分類と物体検出のディープラーニング推論が可能になります。十分に学習したコンピューター・ビジョン・モデルでは、物体認識、人、物体、ビジュアルの細部の検出と認識、動きの追跡もできるようになります。

コンピューター・ビジョンは、製造、小売、ヘルスケア、スマートシティーなど、さまざまな業界で使用され、企業がほぼリアルタイムで状況に対応して行動するのを支援します。これにより、プロセスの改善と自動化、潜在的な問題点の早期発見、重大な状況への迅速な対応、顧客体験の向上を実現できます。