データの整理と保存を行うシステムであるデータベースは、あらゆる分析戦略の基盤を形成します。データベースシステムの構造と基本的なアーキテクチャーをきちんと整えることで、高い価値を提供するサポートの行き届いた構造と、自らの重みで崩れてしまうものとの違いが出ます。
データベースは通常、データ・パイプラインの第 2 段階であるデータ処理 (「準備と保存」段階) に関与します。分析のアプリケーションとプラットフォームは、データベースに含まれる情報を使用して、組織が過去を理解し、未来を予測する支援をします。
詐欺行為を検出するために金融取引を分析する銀行から、殺虫剤使用を削減するためにビデオを使用するスマートな農企業まで、組織には手元の課題に対応するために最適化されたデータベースが必要です。組織がデータベース・ソフトウェアとシステムを選択するにあたって、問題解決のために効果的に機能するテクノロジーを選ぶことが重要です。
データベースのスムーズな運用は、ソフトウェアだけではなくハードウェアにも左右されます。様々なタイプのコンピューティング (CPU、FPGA、アクセラレーター)、ストレージ、メモリー、ネットワーク、ソフトウェア・ライブラリー、Java 最適化を含む適切なインフラストラクチャーを設置することで、データベースのパフォーマンスを向上させ、データベース管理を容易にすることができます。
DBMS ソフトウェア
DBMS ソフトウェアにより、データベースに情報を保存し取得することが可能になります。DBMS ソフトウェアには、データベースとの相互作用を可能にするユーザー・インターフェイスだけでなく、ワークロードを優先し、アクセスを高速化する最適化機能も含まれています。
人気の DBMS ソフトウェアには、Oracle、SAP HANA、Microsoft* SQL Server、Splunk、Apache Cassandra があります。それぞれの DBMS は、ツリー、アレイ、スタック、グラフなど、特定の種類のデータ構造を使用し、データの整理と効率的な管理を行います。
データベースの種類
企業アナリティクスは、多くのソースの様々な種類のデータから値を抽出する機能を有しています。分析戦略の最適化には、データベース・レベルから開始し、特定のビジネスニーズに効果的に機能する DBMS を選択することが必要です。重要なトレードオフは一貫性、可用性、分断耐性の間に存在し、それらすべてに機能するデータベース技術はありません。これは CAP 定理と呼ばれるコンセプトであり、特定のビジネスニーズにどのデータベースの強みが最も重要かを組織が選択する必要があるという意味です。
データベースはオンプレミスまたはクラウド内でホストすることが可能です。クラウド・データベースはスケーラビリティーで知られていますが、一部のビジネスは、特に規制された業界では、よりセキュリティーに対する制御を行うためにオンプレミスでのデータ保持を好みます。
プログラミング言語は、データ構造を定義し、データの操作と分析に不可欠です。異なるデータベースの製品と種類は、特定のデータタイプ、機能、使用事例ごとに最適化されたプログラミング言語を使用します。大企業の多くはデータを効率的に整理し、採用するために複数の種類のデータベースを必要とします。
リレーショナル・データベース
リレーショナル・データベースは、データ間の関係性を表す標準化されたデータ表に基づき、一般的に構造化照会言語 (SQL) を使用します。リレーショナル・データベースは、金融取引や在庫追跡など一貫したルールと関係により構造化されたデータの管理に非常に効果的です。リレーショナル・データベース・ソフトウェアには、Oracle、Microsoft* SQL Server、Azure SQLがあります。
- OLTP
OLTP (オンライン・トランザクション処理) は、トランザクション指向のタスクに焦点を当てたデータ処理のカテゴリーです。OLTPには、通常データベースへの少量のデータの挿入、更新、および / または削除が含まれています。
データベースにおいて最も一般的なアプリケーションの 1 つがトランザクション処理です。OLTP は、多数の同時ユーザーとのトランザクション処理に特化したデータベースへのアクセス方法です。OLTP は Oracle、IBM、Microsoft データベースを使用する一般的な方法です。
- OLAP
分析目的で多量の歴史的情報を見るために、企業はオンライン分析処理 (OLAP) を使用することがあります。OLAP クエリーは、通常多次元データモデルを使用しますが、関係データモデルを使用するものもあります。データ・ウェアハウスは、分析向けに特別に設計された特殊な種類の OLAP です。
オブジェクト指向のデータベース
オブジェクト指向のデータベースでは、情報がオブジェクトとオブジェクトの種類として表現されます。オブジェクト指向とリレーショナル・データベースのハイブリッド型は、オブジェクト関係データベースと呼ばれます。
非リレーショナル・データベース
時に NoSQL データベースと呼ばれる非リレーショナル・データベースは、テーブル構造との関係性がありません。通常、組織向けメタデータを使用するこれらのデータベースは、画像やビデオといった非構造データや複雑なデータタイプを管理するのに効果的です。MongoDB と Apache Cassandra は、一般的な非リレーショナル・データベース・ソフトウェアの例です。
- キーバリュー・データベース
これはキーバリュー・ストアとも呼ばれる NoSQL データベースの最もシンプルな型です。Redis と Oracle NoSQL データベースは、どちらもキーバリュー・データベースであり、独自の識別「キー」を用いてデータを保存、取得するハッシュ表を使用します。
- ワイドカラム・ストア
ワイドカラム・ストアでは、データは関連する情報の列に保存されます。これらのデータベースで最も一般的な Cassandra は、大規模なデータセット向けのスケーラビリティと高速なクエリーを提供します。
- ドキュメント・データベース
ドキュメント・ストアとも呼ばれ、データを「ドキュメント」と呼ばれる複雑な記録として保存します。これにはメタデータやデータ自身に関する情報が含まれています。ドキュメントには画像やビデオなど、あらゆるタイプのデータが含まれます。
- グラフ・データベース
別の種類の NoSQL データベースであるグラフ・データベースは、関係性を定義するグラフ構造に基づいてデータを保存します。グラフ・データベースは、高度に接続された情報の高速クエリーと大容量データ処理を可能にするよう設計されています。SAP HANA と OrientDB はどちらもグラフ・データベース・モデルを使用します。
プロセッサーからライブラリーと Java の最適化まで、インテルのイノベーションはデータベースのパフォーマンスを向上させ、世界中の組織のためにデータベース管理を容易にします。
データベース管理向けインテル® テクノロジー
大幅にスケーリングされたデータセットを使用するデータベースの最適化には、データベースと分析のワークロードを効果的にサポートするハードウェアが必要です。
コンピューティングとメモリーは、クエリーとデータのストリーミングを迅速に進める処理命令により、極めて効率的な方法で動作する必要があります。データの保存とアクセスは、時間的制約がある重要なワークロードを自動的に優先する階層化に基づいています。
インテルは、データ処理を加速するために AVX-512 や TMUL などの指示を組み込む、シリコンレベルでのイノベーションを推進しています。
インテルでは、パフォーマンスを念頭に設計されたハードウェアによるデータベースへのサポートに加えて、オープンソースのソフトウェア開発にも力を注いでいます。インテルの全チームが、オープンソースとデータベース・アプリケーション開発者コミュニティ全体における開発の加速化を目的として Java の最適化に専念しています。
データベース管理向けインテル® テクノロジーとソフトウェア | |
---|---|
インテル® Xeon® スケーラブル・プロセッサー・ファミリー | 最新世代のインテル® Xeon® スケーラブル・プロセッサーは、データベース・ワークロードのオフロードとコンピューティング・パフォーマンスの向上のために設計されたシリコンの最適化により、お好みのデータベース・システムとツールをサポートします。 |
インテル® Optane™ パーシステント・メモリー | インテル® Optane™ パーシステント・メモリーは最新世代のインテル® Xeon® スケーラブル・プロセッサー・ファミリーと共に提供されます。インメモリー・データベースを高度な分析向けに最適化できるインテル® Optane™ パーシステント・メモリーは、幅広い DBMS プラットフォームとアプリケーションのパフォーマンスを向上させます。 |
インテル® ソリッドステート・ドライブ (インテル® SSD) | インテル® Optane™ SSD やインテル® NVMe SSD を含むインテル® SSD は、長期の読み書き寿命と耐久性を備えたデータストレージを提供します。データベースは、ドライブごとに優れた長寿性で継続的なストリームの読み書き操作を処理することができます。 |
インテル® イーサネット製品 | インテル® イーサネット・ネットワーク・アダプター、コントローラー、およびアクセサリーは、様々な GbE オプションで利用できます。世界中で入手可能、かつ徹底的な互換性テストを経たインテル® イーサネット製品はデータベース接続の主要な選択肢です。 |
ソフトウェア・ライブラリー1 | ストレージ・パフォーマンス開発キット (SPDK) やデータプレーン開発キット (DPDK) を含むインテル® ソフトウェア・ライブラリーは、データベース・アプリケーションの開発を高速化し、開発者によるデータベース・パフォーマンスの最適化を支援します。 |
最適化されたパフォーマンス向けにデータベースを整える
効果的な分析戦略は正しい種類のデータを用いた適切なデータベース・テクノロジーに依存します。分析戦略が成熟し、より多くのアプリケーションにわたってより多様な種類の情報を使用するにつれ、組織が多くの種類のデータベースと複数のデータベース・ベンダーを使用する可能性が高くなります。
データベースを念頭に置いて設計された様々なハードウェア製品と機能、およびソフトウェア・ライブラリー、ツール、最適化により、インテルはデータベース管理の最適化に力を注いでいます。シリコンからソフトウェア開発まで、インテルは現代のデータベース・テクノロジー関連の著名な組織を支援し、未来に向けたイノベーションを発展させるために取り組んでいます。