予測データ分析とは何か、その重要性の理由
予測分析によって、企業はデータ主導のビジネスという新たな時代において競争力を構築できることを説明します。
予測分析とは?
保有しているすべてのデータのうち、十分に利用できていないデータを考えてみてください。標準的な顧客取引で生成されるデータだけでなく、ソーシャルメディア、ウェブ、音声ファイル、画像ドキュメントなど、従来はなかったソースから収集されたデータもあります。今は、これらのデータを、構造化データも非構造化データも同様に、すべて活用して競争力を獲得することが可能になっています。このような洞察を獲得するためのカギが分析、特に予測分析です。
予測分析は、企業が作成、収集するさまざまな種類のデータをすべて使用して、可能な将来の成果に関する洞察を獲得するプロセスです。この言葉の可能性に注目してください。予測分析によって、what-if シナリオの実行と、既存のデータを使用した可能性の評価に基づいて、合理的に将来何が発生する見込みがあるかを予測できます。
予測分析は高度な分析手法の 1 つと考えられています。高度な分析手法は、企業が過去ではなく将来を見つめる手助けになるという点で従来の分析手法とは異なります。つまり、何か起こったかではなく、何が起こる可能性があるかを尋ねることができます。例えば、このエレベーターはあと 50 時間の稼動で修理が必要になるか、さらに、分析の経験と専門知識があればその状況への対処方法も検討できます。あるいは、高度な分析を極めていれば、システムを信頼して、データを分析し、ビジネスにとって最善の措置を実施するだけです。
分析の導入は、5 段階の成熟度曲線にマッピングされます。従来の分析は、この成熟度曲線上の最初の 2 種類の分析から成り、高度な分析はその次の 3 種類で構成されます。
企業における予測分析のメリット?
現在、多くの企業が、従来のビジネス・インテリジェンス (BI) から、予測分析などの高度な分析へと移行したいと考えています。
しかし、予測分析がビジネスにもたらすメリットは何でしょうか。
それは実にさまざまです。最終的には、急速に増え続けている大量のデータ (構造化データと非構造化データの両方) をリアルタイムで活用して、データセンターの稼動時間、SLA などの運用上の課題だけでなく、人員確保、価格設定、在庫管理に関するビジネス上の問題に回答することができるようになります。
実際の例を 2 つ挙げます。
- ある大病院では、最近の規制の変化により患者の再入院を低減するというプレッシャーにさらされていました。この病院が予測分析モデルを構築しました。このモデルでは、患者が貧困、読み書き能力の不足、英語の習熟度の不足、家庭への社会支援の不足、または生活環境の問題に苦しんでいるかどうかなど、ほかの要素の中でも新しい、通常とは異なるデータを検討し、それを患者の電子カルテと組み合わせて、再入院のリスクの高い患者を特定しました。それらの患者を対象として、さらなるケアを提供することによって、この病院では再入院率を劇的に低減し、より多くの患者のケアに向けてリソースを最適化するとともに、数百万ドルのペナルティーの可能性を回避しました。1
- 大手衣料品小売企業では、商品に RFID タグを付け、ほぼリアルタイムで在庫を 100% 可視化できる予測分析モデルに基づきデータを追跡しました。その結果、このモデルにより、来店した買い物客が欲しい商品を見つけられるように店頭で必要とされるスタイルとサイズや、特定の商品の販売に適した「ホットスポット」と最適な時間を予測できました。これにより売上が増加しただけでなく、在庫をより効率的に追跡し、補充することができました。
予測分析に最適なインフラストラクチャーとは?
各タイプの分析には、それぞれ固有のインフラストラクチャー要件があります。最初のステップは、既存のインフラストラクチャーを調査することです。コンピューティング、ネットワーク、ストレージの機能が古くなり、足かせとなっている場所を分析します。
予測分析の場合、インフラストラクチャーを最新化して、必要なパフォーマンス、セキュリティー、およびメモリーまたはストレージを実装する必要があります。インフラストラクチャーには、商用とオープンソースの両方の予測分析ソリューションを実行できるだけの柔軟性が求められます。また、拡張に向けた余裕も必要です。もはや線形に拡大するだけでは十分ではありません。必要なことを達成するには、通常の予想を超えたインフラストラクチャーの拡張が必要になる可能性があります。
インフラストラクチャーは、リアルタイムのインメモリー SAP HANA* や Oracle* Exadata* データベースから、ストリーミング分析 (Storm*、Flink*) およびビッグデータ Hadoop* 導入まで、幅広い分析ワークロードを実行できる必要があります。今は Hadoop* データレイクの構築が必要でも、明日はスタンドアロンの Spark* 環境が必要かもしれません。インフラストラクチャーには、両方を実行できる柔軟性が必要です。
クラウドの検討も忘れてはいけません。目標が大規模な予測分析の場合、クラウド・コンピューティングやクラウドストレージの機能によってインフラストラクチャーを補強でき、オンプレミスとオフプレミスの両方を必要に応じて拡大することも可能です。また、クラウドは、現在計画に入っていないインフラストラクチャーやプラットフォーム・ソリューションの導入もスピードアップできます。
これらすべてを実現するには、業界標準に準拠したインフラストラクチャー・コンポーネントを選択します。しかし、そこで止まってはいけません。それは最小限必要なことです。コンポーネントをテストし、予測分析ワークロード向けに最適化する必要もあります。その範囲は、例えば、汎用プロセッサー機能だけでなく、対象となる分析ワークロードのアクセラレーション向けのカスタマイズ可能な FPGA、メモリー、ストレージ、イーサネット、インターコネクト、およびディープラーニング向けに最適化されたプラットフォームに及びます。
インテルの分析製品
インテル® Xeon® スケーラブル・プロセッサー・ファミリー
新しいインテル® Xeon® スケーラブル・プロセッサーで大きく飛躍し、実用的な洞察の獲得、ハードウェア支援型セキュリティーの活用、動的なサービス提供を展開する方法をご確認ください。
インテル® SSDデータセンター・ファミリー
最高のデータセンター・ストレージ・ソリューションがボトルネックを解消します。デジタルビジネスの要求に応えるインフラストラクチャーを手にしましょう。データセンター向けインテル® SSD は、パフォーマンス、信頼性、耐久性に最適化されています。
予測分析におけるオープンソースの役割?
予測分析の導入に際しオープンソースのツールを評価しない場合、大きなチャンスを逃していると言えます。オープンソースの分析コミュニティーの活動内容は多岐にわたり、Hadoop* から Spark*、Hive* に至るまで高度な分析ツールが生み出されています。このほかにも数多くのツールがあり、グローバルなオープンソース・コミュニティーによって絶えず改善され、進化しています。
オープンソースの予測分析ツールは、(少なくとも最初は) 独自規格の分析プラットフォームよりも大幅に少ないコストで導入できます。このため、予測分析の手始めとしては、オープンソースが魅力的です。一方でオープンソースは極めて柔軟性が高く、幅広い分析ワークロードに対して多様な導入オプションを備えています。
まさにこの柔軟性が、活用の難易度を高めています。オープンソースの道を選択する場合、最新技術についての高度なスキルを有する人材 (データ・サイエンティスト、データエンジニア、データアナリスト) が必要になります。人材を雇うことも、社内で専門知識を育成することもできますが、時間がかかります。大多数の企業が結局コンサルタントを雇い、オープンソース構想のコストが増加します。
一部の企業は、オープンソースを使用して予測分析システムの概念実証 (POC) テストを実施し、その後、実稼動用の独自規格のソリューションに切り替えることを選択します。しかし、オープンソースによって企業はすべてのデータ (構造化 / 非構造化データの両方) を活用し、魅力的な最新の分析の概念をテストできるので、次第にオープンソースが実稼動ソリューションにおいても重要な役割を果たすようになっています。このため、ほとんどの場合、オープンソースと独自規格テクノロジーの混合となり、ジョブに応じて最適なソリューションを選択および組み合わせることで最適な結果を得ることができます。
社内で予測分析のビジネスケースを作成
予測分析の採用において最大の障壁の 1 つは、提案された構想によってビジネスにもたらされる価値の評価です。
BI ソリューションはすでに、なくてはならないものになっているので、その価値が理解されています。しかし、予測分析の価値は明確でしょうか。まず、新しいインフラストラクチャーの構築、人材の雇用やスキルの育成、および分析プラットフォームやツールの購入にかかる先行投資費用の正当性を説明する必要があります。その投資によって、従来の分析が過去 10 年間に提供してきた「過去を振り返る」洞察以上のものが得られることを証明しなければなりません。
価値の確保に関する第 1 の重要なルールは、ビジネスにとって魅力的であることです。予測分析は、孤立して存在するわけではなく、活用によって始めて、ビジネスの問題を解決します。ビジネスユーザーに問い合わせて、予測分析で解決できる課題を特定してください。解決しようと努力してきたものの、現在のデータソースや分析システムでは実現できなかった課題を選択します。あるいは、新しいデータソース、テストされていないデータソース、または非構造化データのデータソースなどの理由により、これまで解決しようと検討されたことのない新しい問題を選択します。
第 2 のルールは小さく始めることです。予測分析には計り知れない面があります。結局、毎日変化する極めて複雑な分野なのです。新しいソリューションや新しいツールが、特にオープンソースの世界では、常に市場に出てきており、それらすべてが互いにどのように統合されるかは明確ではありません。また、データ・セキュリティーに関する考慮事項もあります。
次のような基本的な質問を自分に問いかけてください。ビジネスのために、正確には何を達成しようとしているのか?予測分析を使用して、どのように従来の分析よりも多くの洞察を得ることができるか?必要なデータは利用できるか?また、それによってビジネスの競争力が得られるか?ROI の予測値はいくらか?
インテルとの連携の利点
インテルは、予測分析での成功を支援するイノベーションを推進しています。インテル® テクノロジーはインフラストラクチャーのあらゆる側面にわたり、企業における予測分析の活用を通じた競争力の向上に役立っています。
特に、インテルは、世界のコンピューティング、ネットワーク、ストレージに関する標準を定義し、推進しています。インテルのイノベーションは、業界内の予測分析ソリューションの幅広いエコシステムでテストされ、最適化されています。また、幅広いワークロード (実行環境がオープンソース・プラットフォームか独自規格プラットフォームかにかかわらず) 向けの予測分析対応インフラストラクチャーをサポートしています。この新しい予測分析プラットフォームはすべてインテル® アーキテクチャーを基盤としているため、さまざまな分析の場面で各導入の一部として分散型分析を行う可能性が広がります。
コンピューティングに関しては、インテル® プロセッサーがあらゆる予測分析のニーズを網羅しています。このポートフォリオは、汎用のインテル® Xeon® プロセッサーにとどまらず、分析ワークロードのアクセラレーション向けのカスタマイズ可能な FPGA、メモリー、ストレージ、イーサネット、インターコネクトなど、重要な補助的テクノロジーに及んでいます。
予測分析向けにストレージを最新化すると、インテル® テクノロジーによって、画期的なアプリケーション・パフォーマンスを実現し、洞察までの時間を短縮することができます。インテル® プロセッサー、チップセット、ファームウェア、ソフトウェア、およびドライバーとともに、シームレスなパフォーマンスと機能の向上を実現するよう設計されたインテルのストレージ・ソリューションによって、速度、低価格、パフォーマンスが満たされます。
インテルは予測分析のネットワークの側面も支援しています。データをデータレイクまたはウェアハウスからコンピューティング・インフラストラクチャーに移動する際の遅延は、リアルタイム動作に差し支える場合があります。この遅延を回避できるように、インテルは、ネットワーク・パイプ全体にわたる予測分析ワークロードの高速化に利用できる最速クラスのファブリックを提供しています。
セキュリティーも忘れてはいけません。インテルのハードウェアおよびソフトウェアのセキュリティー・ツールによって、アクセス・セキュリティーだけでなく、保管中と移動中のデータのセキュリティーを保護できます。
ここをクリックして、インテルが組織の予測分析戦略をどのように支援できるか、詳細を確認してください。
高度な分析エコシステムの活用
Microsoft
Windows Server* 2016 は、弾力性に富み、コスト効果の高いソフトウェア・デファインド・コンピューティング、ストレージ、ネットワークの各機能により、高度なデータセンターを促進します。インテルのテクノロジーに最適化されており、優れたパフォーマンス、最適化、効率、拡張性を実現します。
Cloudera
Cloudera とインテルは、セキュリティー、パフォーマンス、管理、ガバナンスについて Apache* Hadoop* フレームワークにエンタープライズ・クラスのイノベーションを提供しています。
SAS
次世代インテル® Xeon® スケーラブル・プロセッサー・プラットフォームのパワーとパフォーマンスによって、SAS は小売業者がより複雑な分析をこれまでにない高速で実行できるよう支援することができます。
SAP
SAP HANA2* とインテル® Xeon® スケーラブル・プラットフォームは、企業の意思決定者が中断されることなく、確実にデータを利用できるようにすることで、イノベーションと成果を促進します。
Dell EMC
Dell EMC ITは、インテル® Xeon® スケーラブル・プロセッサー・プラットフォームを利用してデータレイク・アーキテクチャーを開発し、ビジネスを推進する真のインサイトを実現しました。