マシンラーニングを軌道に乗せる方法

マシンラーニングでは、システム、アーキテクチャー、データに対する体系的なアプローチが必要です。

マシンラーニング・ソリューション構築の基本

  • マシンラーニング・ソリューションによって、ビッグデータや IoT の変革の可能性を最大限に引き出すことができます。

  • マシンラーニング構想の成功は、具体的なビジネスチャンスや課題、そしてビジネス部門と IT 部門の連携から始まります。

  • マシンラーニングによって、使用できるデータの量と種類が増え、構造化データセットよりも低コストで幅広く新しいソースを活用することができます。

  • 大規模データを高速処理できるマシンラーニング・アルゴリズムの導入は、複数の統合コア、高速のメモリー・サブシステム、および膨大なデータの並列処理が可能なアーキテクチャーを備えたシステムでサポートする必要があります。

BUILT IN - ARTICLE INTRO SECOND COMPONENT

マシンラーニング分析の開発で、即座かつ長期的なメリットを手に入れる

1. マシンラーニングを最新化戦略の一部に   

マシンラーニングは研究室での何十年もの研究を経て、現在、膨大な量のさまざまなタイプのデータから高速でパターンを識別するこのテクノロジーの並外れたパワーの実用化に大きな注目が集まっています。例えば、不正検出、顧客確認の 360 度ビュー、顔認識、ワークフロー管理、ショッピングのパーソナライズなどへの利用です。

このような構想からも大きな見返りを期待できますが、 高度な分析システムの構築にはさらに素晴らしいチャンスがあります。マシンラーニングのほかにない優れた機能を使用して、ますます増大するデータの山から洞察を見出し、整理し、活用して、ビッグデータや IoT による、より深い領域からの変革の可能性を最大限に引き出すことができるからです。

マシンラーニングを次のレベルに到達させるには、適切なビジネスケースの開発、大規模データを高速処理できるマシンラーニング・アルゴリズムの導入、複数の統合コアを搭載したプロセッサーと高速のメモリー・サブシステムを備えたシステムの使用、および大量のデータをリアルタイムに処理できるアーキテクチャーの開発を行う必要があります。

多くの企業にとって、マシンラーニング体験を基盤として (またはマシンラーニング体験を開始して)、知識を深め、この高度なデータ分析テクノロジーが提供する利点と競争力を得るには、今が絶好のタイミングです。

重要な最初のステップは、マシンラーニングと高度な分析がデジタル革命の基本部分であるという点を認識することです。

2. ビジネスケースから取りかかる (小さく始める)

企業が高度な分析を進める場合、IT 部門はビジネス上の意思決定者にも初期の開発フェーズから参入してもらうようにすることが必要です。経営側ですでに新しい洞察の獲得方法を検討している可能性があるためです。多くの場合、分析アプリケーションなど必要なソリューションの導入は、IT 部門との連携を考慮せずに計画されています。そのため、いち早く連携することが全体にとってメリットであり、マシンラーニングに関してはこれ以外に開始すべき点はありません。

このテクノロジーによって数々の業務プロセスを改善し、新しいビジネスモデル、製品、サービスを生み出すことが可能です。また、収益性の高い、予想外の新たな方向へと進む最善の方法に集中することもできます。ビジネス部門と IT 部門の強力な連携によって、期待できそうなあらゆるチャンスを容易に選び出すことができます。

マシンラーニング構想の成功は、具体的なビジネスチャンスや問題から始まります。例えば、インテルはマシンラーニングの概念実証プロジェクトを展開して、4 つの地域と 8 つの言語にわたって 8 種類の業種で最も可能性の高い販売代理店を特定しました。販売代理店を分類し、各社のウェブサイトのコンテンツから顧客とのコミュニケーションについてデータマイニングを行うアルゴリズムにより、販売代理店のプロファイルを作成。この分析により、販売代理店がどのような売り込みを行っているかに関する洞察が得られました。この情報の結果として、インテルのセールス & マーケティング部門がまだ把握していなかった顧客をマシンラーニング・プロジェクトにより発見することができました。これはどのような組織にとっても最も優先度の高いことです。1

結果は目覚ましいものでした。マシンラーニング・ソリューションを導入した後、2 倍の販売代理店がリードから認定リードへと進みました。電子メール・ニュースレターへのクリック率は 3 倍に向上し、対象の販売代理店は、その他の販売パイプラインよりも 3 倍高い割合でインテルのトレーニングを修了しました。

結果的に明確な指標となる限定したパラメーターでプロジェクトを開始することにより、成功を収め、マシンラーニングに対する強い関心を組織全体に行きわたらせて、予測分析をさらに高度に使用したいという要求を引き出すことができます。

3. 新しいデータソースを探し出す

マシンラーニングは、ほかのタイプの分析以上に、多種多様な大量のデータソースに依存します。大量の (通常は非構造化) データが必要なことを考えると、データの作成、実行、決定、保管を行う場所の確認は不可欠です。

サイロ化した、不完全または不適切なデータは、マシンラーニング・プロジェクトと並行して対処する必要があります。時間と手間をかけてデータのプルーニングとクリーニングを行い、出力結果の価値を引き下げかねない分析環境のノイズを除去してください。

ですが、ほかのタイプの分析ほどデータがクリーンでなくてもよいこともマシンラーニングの大きな利点です。さらに都合のよいことに、マシンラーニングによって、ビッグデータの量や種類を増やして、当初の構造化セットよりも大規模で低コストの新しいソースを見つけ出すことができます。

マシンラーニングを進めるにつれ、どの程度のデータ量が必要で、現在のデータセットを適応させてその価値を最大限に引き出すにはどうすればいいか注意深く分析しなければなりません。新しいデータソースを探すと、天気に関する正確な情報、人や製品の場所と移動など、外からデータが入ってくることもよくあります。

例えば、相手が電話の受信状態の悪い場所を、どんよりとした天気の中移動していると広告主が判断できたとしても、広告が対象者に届かないこともあります。このような情報すべてをすぐに組み合わせることで、マーケティング活動を大幅に改善できます。

先を見越してデータソースを扱うと、データ・サイエンティストは、問題の綿密な組み立て、試験的なデータ分析、データモデリングにより、たとえ期待したほどのデータ品質を得られなくても、十分な成果を引き出せます。

要するに、マシンラーニングにはデータソースとその使用方法に関する広範な検討が必要とされるということです。

4. エンドツーエンドのソリューションを作成する

マシンラーニングの導入を成功させるには、コンピューティング、ストレージ、メモリー、ネットワークを含め、極めて柔軟性に優れた、拡張性の高いインフラストラクチャーで、学習処理とその他の高度分析の開発、トレーニング、導入を行うことが必要です。

ほかの分析プロジェクトと同様に、マシンラーニングは最新化から始まります。これには、新たな用途の組込みや構築を行うときに、どのように従来のニーズを中断することなくサポートできるか理解することも含まれます。

大規模データを高速処理できるマシンラーニング・アルゴリズムの導入は、複数の統合コア、高速のメモリー・サブシステム、リアルタイムのセンサー入力など、膨大なデータの処理を並列化できるアーキテクチャーを備えたシステムによってサポートする必要があります。Apache* Hadoop* などのアーキテクチャーを利用すると、大容量データをフルアトミック形式で保存でき、初回のマシンラーニングとトレーニングでデータポイントを設定できます。

各プロジェクトに対して、情報の学習と処理が必要な対象を慎重に検討してください。これによって、既存のインフラストラクチャーを最大限に活用する方法と、クラウドベースのプラットフォームやストレージを含めるべきかどうか判断することができます。

エンドツーエンドのアーキテクチャーの観点からマシンラーニングに取り組むことで、現在の成功可能性を向上させると同時に、将来的な高度分析の利用に備えることができます。

5. マシンラーニングを将来の分析計画に組み込む

マシンラーニングは、最初は手強いように見えるかもしれませんが、 導入に成功した企業は、このテクノロジーを高度な分析への道筋とみなしています。

通常、マシンラーニングは運用面での向上に重点を置いて開始します。業種内では進んでいる企業でも、将来に目を向け、マシンラーニングによって新しい収益またはビジネスモデルをどのように推進できるか思い巡らしながら、関連スキルを育成する必要があります。初めてこのテクノロジーに進出する場合でも、マシンラーニングの将来的な利点について検討してください。

これには、人間の脳の動きを模倣する「ディープラーニング」などのマシンラーニング技術による素晴らしい体験が関係してきます。現時点で最先端のマシンラーニング手法であるディープ・ニューラル・ネットワークは、画像認識、動画処理、自然言語処理、自動運転に必要なすべての複雑な視覚的指示の把握に使用されています。

このようなデータの利用は、企業の分析技能を成熟させる重要な部分です。データの価値を最大限に引き出せるのは、過去に関する限られた洞察を提供する従来のビジネス・インテリジェンス・システムを超えて、 将来に関する予測を行い、その予測に基づいて行動する、さらに高度な分析を採用するときだけです。 

今後ますますマシンラーニングはこれを実現する際に重要な役割を果たすようになります。必ず、マシンラーニングを企業の分析 / ビッグデータ戦略と結び付けてください。

マシンラーニングの取り組みを支援するインテル 

インテルは、マシンラーニングや分析に必要なエンドツーエンドの安定したアーキテクチャーを構築するために、さまざまなリソースやテクノロジーを提供しています。また、業界トップのシステム・インテグレーターやテクノロジー・ベンダーと連携して、分散型ストレージおよびビッグデータ処理向けの独自フレームワークやオープンソース・フレームワークを提供しています。

インテルの環境にはマシンラーニングを強化する幅広いソリューションがあります。SAP、SAS、IBMOracle をはじめとする主要企業が、マシンラーニング製品や機能を提供してオープンソースに大きく貢献している一方で、Cloudera などのトップクラスのベンダーがクラウドベースおよびオープンソースのマシンラーニングを提供しています。

標準的なシステムを使用して、高度なソフトウェアを使用する高度な分析を実現できます。しかし、データ量が増加するにつれ、アルゴリズムの動作時間が急激に長くなり、顧客の要件を満たすことができなくなります。インテルは、マシンラーニング・フレームワークとアルゴリズムに関するこのような問題に対処できるよう支援します。 

専用ハードウェアによって、マシンラーニングを新たなレベルに引き上げることができます。高度並列ワークロード向けに設計されたインテル初のホスト・プロセッサーであるインテル® Xeon Phi™ プロセッサーは、マシンラーニングに必要な基準に対応しています。高度な画像認識を実行するニューラル・ネットワークである AlexNet について考えてみましょう。このニューラル・ネットワークでは、マシンラーニング・アルゴリズムに数百万もの画像を入力して、パターンを認識します。これまでは、この処理に数日かかる場合もありました。コアとスレッドに対してほぼ直線的に拡張できるインテル® Xeon Phi™ プロセッサーを搭載することで、AlexNet の学習処理時間は 1/50 に短縮されました。2
 マシンラーニングがビジネスに必須となるにつれ、企業はインフラストラクチャーを増強して、デジタル・エンタープライズに対応しなければなりません。

インテル® マス・カーネル・ライブラリー (インテル® MKL) とインテル® データ・アナリティクス・アクセラレーション・ライブラリー (インテル® DAAL) は、マシンラーニング・アルゴリズム用のビルディング・ブロックを提供します。これらはインテル® プロセッサー上で高いパフォーマンスを実現するよう高度に調整されています。中国でトップクラスのビッグデータ分析テクノロジー / サービス・プロバイダーである MeritData, Inc. は、これらのリソースを使用して、同社の複数のデータマイニング・アルゴリズムを最適化し、3 倍 ~ 14 倍の処理能力を実現しました。3