AI は、乳がん腫瘍悪性度分類の一貫性と再現性を向上させることができますが、AI ソリューションを構築することは困難です。トレーニング用の画像に注釈を付けることは、時間と手間がかかります。またラベル付き画像で利用可能なものは、もうあまり多くありません。
2 人の研究者が、新しいアプローチを開拓しました。ラベル付き画像とラベルなし画像を一緒に使用して、注釈の作業負荷を最小限に抑えながら、高い精度を達成します。このソリューションは GPU で失敗したため、インテルは第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーを搭載したテクノロジー・アーキテクチャーを支援しました。
課題
- ディープラーニング・ソリューションは、がん診断に役立つ可能性がありますが、トレーニングにはラベル付き画像が必要です。
- 病理組織学的画像のラベル化には、時間がかかり、労力を要します。
- 最良の結果を得るためには、ディープラーニング・ソリューションは高解像度の画像を処理できる必要があり、GPU は AI モデル全体をメモリーに保持することはできません。
ソリューション
- NAS-SGAN アプローチは、ラベルなし画像を使用してデータ分布を理解し、ラベル付き画像を使用してがんの評価を行います。
- 第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリー搭載の 4 台のサーバーが、サーバーあたり 192GB のメモリーで、並列処理でソリューションをトレーニングします。
- TensorFlow 向けインテル® オプティマイゼーションは、プロセッサーのアクセラレーション機能を簡単に使用することができます。
成果
- NAS-SGAN は、20% の注釈付きデータのみで、98% の精度を達成しました。1
- この新しいソリューションは、がんを検出するだけでなく分類もで可能で、従来の敵対的生成ネットワーク (GAN) をベースとしたソリューションではできなかったことを実現しています。
- このソリューションでは、医師が画像と分類を確認して治療方針を決めることで、診断を合理化します。
限られたラベル付きデータによるがん AI の課題
乳がんは、世界で最も多いがんであり、2020年には 230 万人の女性が診断されました。2 思春期以降のあらゆる年齢で、世界中で、主に女性が罹患します。
疾患の診断とモニタリングには、病理組織学的画像が用いられます。これは顕微鏡スケールの組織標本の画像です。核異型スコアリング (NAS) は、腫瘍細胞が正常な組織とどのくらい異なるかで腫瘍を評価します。世界保健機関 (WHO) は、乳がん悪性度分類の標準として、Nottingham Grading System (NGS) を採用しています。NGS は、患者の生存率と関連しており、個別の治療計画の指針として用いることができます。
手動で画像を評価することは難しいことです。画像を分析する医師は、一貫して同じ悪性度分類の決定を下すとは限らず、分析を行う医師の間で意見が異なる可能性があります。これも時間のかかるプロセスです。
ディープラーニングを使用した自動スクリーニングは、手動分析の限界を克服することができます。しかし、トレーニング・データが不十分であるため、ディープラーニング・モデルを生成することは困難です。生の画像は、数分でコスト効率よく作成できますが、ラベル付けのプロセスには時間と手間がかかります。ラベル付き病理学的画像は、不足しています。
さらに、ディープラーニング・モデルでは、最良の結果を得るために、大きな画像 (1024x1024 ピクセル) を処理する必要があります。コーチン科学技術大学の人工知能・コンピューター・ビジョン研究所の Madhu Nair 博士は、次のように述べています。「画像を正確に評価するためには、形態学的特徴をうまく抽出することが重要です」。「がんの悪性度と病期は、形態学的特徴によって異なります。画像のサイズを単純に縮小して、モデルのサイズに合わせてすることはできません。高解像度の画像を使用して、すべての違いを抽出する必要があります。」
Asha Das 博士 (インド、ユニオン・クリスチャン・カレッジ) は、Nair 博士と協力して、この課題に取り組んでいました。Nair 博士は、次のように述べています。「私たちの疑問は、少ないラベル付きデータを使用してモデルを開発しても、高い精度が得られるだろうかということでした」。
敵対的生成ネットワークが AI の汎化性を支援
敵対的生成ネットワーク (GAN) は、ニューラル・ネットワーク・ソリューションの一種であり、新しい画像を生成し、画像が本物か偽物かを判断するために使用できます。GAN は、画像を作成するジェネレーターと、画像がサンプルセットと一致するかどうかを判断する判別器が連携する 2 つのニューラル・ネットワークで構成されています。
GAN を使用して、病理学的画像を生成することができます。これらは、真の病理学的画像のトレーニング・データセットに追加することで、ディープラーニング・モデルはまだ見たことがない画像が示されると、より良く汎化することができます。
また、GAN は過去にも腫瘍やその他の異常を検出するために使用されていましたが、これまでの実装では、画像の評価ができませんでした。
図 1.NAS-SGAN モデルは、ラベルなし画像でトレーニング・データセットを拡大する新しい画像を生成し、ラベル付き画像で判別器をトレーニングして、異なるがんの悪性度分類を行います。
Das 博士と Nair 博士は、NAS-SGAN と呼ばれるモデルを作成しました。このモデルは、さまざまながんの悪性度を識別することができます (図 1 を参照)。その名称は、核異型スコアリング (NAS) 半教師あり敵対的生成ネットワーク (SGAN) の略です。NAS-SGAN は、ラベルなし画像でデータ分布を把握し、ラベル付き画像でがんの評価を行います。
次の 2 つのフェーズで機能します。
- GAN は、本物の病理学的画像と区別できない画像を作成するために使用されます。GAN は、比較的簡単に取得されるラベルなし画像を使用してトレーニングされます。新しい画像は、ソリューションがデータ分布を把握するために使用されます。
- その後、GAN 判別器をラベル付き画像でトレーニングして、がんの悪性度を予測します。
GPU を使用してソリューションを実装しようとする試みは、失敗しました。Nair 博士は、次のように述べています。「実行に数日かかり、時には停止することもあります」。「これらのマシンで、プロジェクトを完了できませんでした」。
Das 博士と Nair 博士は、インテルと連携して、第 2 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーを使用して、ソリューションを実装しました。4 台のサーバーは、ディープラーニング・アクセラレーターなしでコンピュート・クラスターとして編成されました。サーバーとストレージは、25G イーサネット・ネットワークを使用して接続されました。
Nair 博士は、次のように述べています。「インテル® アーキテクチャーは、驚異的でした」。「数時間でトレーニングを完了することができました。サーバーには、192GB のメモリーが搭載され、グラフィックス・カードで利用可能な 40GB または 80GB を超えていたため、高解像度の画像を使用して、モデル全体をメモリーに収めることができました」。
ソフトウェア・スタックは、インテル® プロセッサーのアクセラレーション機能を使用するように設計された TensorFlow 向けインテル® オプティマイゼーションを使用しました。インテル® ディープラーニング・ブースト (インテル® DL ブースト) が含まれており、ディープラーニング・トレーニングでよく使用される行列の演算を加速します。Nair 博士は、次のように述べています。「TensorFlow 向けインテル® オプティマイゼーションは、TensorFlow のメイン・バージョンと同じように動作しました」。
オープンソースの Horovod トレーニング・フレームワークは、サーバークラスター全体で分散トレーニングを可能にするために使用されました。
インテルによる研究支援
インテルは、Das 博士と Nair 博士とプロジェクトの技術的な側面で、密接に連携しました。Nair 博士は、次のように述べています。「アイデアはありましたが、効果があるかどうか心配していました」。「インテルチームで問題点を共有し、すぐにこの作業の重要性を理解してくれたことに非常に満足しました。この分散アーキテクチャーを使用する機会を私たちに与えてくれました」。
彼は、次のように付け加えました。「また彼らは、モデルを改善するのを助けてくれて、それが動くように最適化を共有してくれました。それが、私たちが成功することができた理由です。インテルの支援に感謝しています。インテルチームとの作業は本当に素晴らしい経験であり、このコラボレーションを継続することを楽しみにしています」。
限られたラベル付きトレーニング・データで高精度を実現
Das 博士と Nair 博士は、NAS-SGAN のパフォーマンスを、乳がんを検出するために使用される他の 10 種類の GAN アルゴリズムと比較しました。NASSGAN は次位の GAN(WGAN-GP) よりも約 10% 高い 98% の精度を達成しました。1 精度は 97% で、WGANGP よりも 18% 高くなりました。1
また、NAS-SGAN は調和平均を表す F1 スコアでも優れていました。1 それには (特に) 偽陽性と偽陰性が含まれます。NAS-GAN の F1 スコアは 97% で、WGAN-GP よりも 15% 高くなりました。1
Das 博士は、次のように述べています。「結果には本当に満足していました」。「わずか 20% の注釈付きデータで、98% の精度を達成できたことは注目に値します。それは本当にエキサイティングなことです」。
彼女は、次のように付け加えました。「我々のモデルは、2 つの GAN を使用する方法で、評価を分ける特徴をうまく判別することができます。中サイズの画像でも、ほぼ同等の結果を得ることができました」。
他の GAN を使用して、医師は画像を調べて評価する必要がありました。NAS-SGAN の自動スコアリングは、診断プロセスと分析プロセスを合理化し、評価の一貫性と正確性を向上するのに役立ちます。医師は、画像とがんの評価を確認して、治療法を決定することができます。
今後については?研究者は脳動脈瘤による死亡や内視鏡検査によるポリープ分類に関して、同様のアプローチをどのように使用できるのか、検討しています。
得られた教訓
このプロジェクトから得られる重要な教訓は、次のとおりです。
- NAS-SGAN アルゴリズムは、がんの画像評価機能を追加することで、乳がんスクリーニング用の他の GAN モデルに関して欠点に対処します。
- NAS-SGAN は、限られた量の注釈付きデータを使用しても、高い精度の結果を達成します。1 これにより、画像分類に時間と労力のかかるプロセスを最小限に抑えることができます。
- 研究者は、GPU を使用して、このプロジェクトを実現できませんでした。CPU を使用することで、1024x1024 ピクセルの高解像度のトレーニング画像を使用して AI モデルをトレーニングし、モデル全体をメモリーに保持することができました。
- TensorFlow 向けインテル® オプティマイゼーションには、インテルアーキテクチャーでの TensorFlow のパフォーマンスを加速する機能が含まれています。
このソリューションを支える技術
- インテル® Xeon® Gold 6248 プロセッサー この 2 ソケット・プロセッサーは、20 コアを提供します。プロセッサーは、ディープラーニング・ソリューション向けに 192GB のメモリーを備えたサーバーに収められています。
- TensorFlow 向けインテル® オプティマイゼーション このソフトウェアは、インテル® プロセッサーのアクセラレーション機能を活用することで、インテル® アーキテクチャーにおける TensorFlow のパフォーマンスを向上します。
- Horovod。このオープンソース・ソリューションにより、研究者は複数のサーバー間でトレーニングを実行し、単一のクラスターで作業することが可能になりました。各サーバーは、64 枚の画像バッチから 16 枚の画像を同時に処理しました。