ナビゲーション リンクのスキップHOMEソリューション流通・小売DWH分析システム

ソリューション

DWH分析システム

データウェアハウス(DWH)は、企業活動におけるデータの倉庫です。
手始めに、効果的な部分でのデータマートとして利用してみてはいかがですか?
DWHを活用するには、OLAP(Online Analytic Processing)と呼ばれる抽出ツールにより、ダイス&スライス操作を利用者が高速に行えるようにキューブDBを構築します。

このキューブを作成するには、業務分析を含め、問題発見に有効なデータモデルの設計がキーポイントになります。さらに、PDCAを科学的に行うためには、マイニングツールによって統計的に処理を行う(データマイニング)ことも重要です。

DWHのためのDBシステムは、大規模(数億レコードを超える以上)DWHではRedBrick(IBM社製)、比較的中・小規模(1億レコード以下程度)なDWHではMicrosoft SQL Server OLAP Serviceまで、いくつかのバリエーションをご用意しております。

データモデリングサービス

DWHでは、従来のRDBとは設計方法が異なります。特にインデックスは検索速度を向上させるために、OLTP(Online Transaction Processing)機能を犠牲にして、各データベースベンダー各社が工夫してスターインデックスやビットマップインデックスを実装しています。

そのためにキー(主キー/外部キー)やパティショニングの設計が非常に重要になります。 OLAPのためのキューブ設計はさらに重要で、目的や用途をある程度想定して設計する必要があります。OLAPのドリル&ダイス機能はOLAPの設計により使いやすいものにもなりますが、設計を誤ると非常に難解なものになってしまいます。

そこでSYNCでは、お客様の現場ニーズと、SYNCでご用意いたしますテンプレートにより、要求定義及び設計を行い、小規模なDWHから大規模なDWHまで幅広くサポートいたします。

Microsoft SQL Server OLAP Service ローコスト構成例

Microsoft社が提供するSQL Server製品には、扱いやすいOLAPサービスがバンドルされています。このサービスでは、 Microsoft Officeファミリ製品であるExcelとの連携により、使い慣れた Excelの環境下でのOLAPが提供されています。

また、Office Webコンポーネントを利用することで、Web ブラウザ上からも同じ操作を行うことが可能になります。このモデルの想定レコード件数は、最大で1億レコード以下です。

また、SQLを効率よく処理するために、2CPU構成をおすすめいたしますが、1CPUでも、1000万件以下程度のレコードであれば、実用ベースで使用できます。

データマイニングサービス

事象発見のためには、OLAPは有効なツールですが、PDCAにおける科学的仮説検証にはデータマイニングも重要になります。商品構成(品揃えや価格戦略)変更における効果測定を行うためには、結果を統計的に処理して、科学的な裏付けをもって、次のアクションを行うべきだと考えております。

SYNCでは、統計的分析におけるコンサルティングサービスを実施しております。

IBM RedBrick Warehouse 大規模ハイエンド構成例

IBM社が提供するRedBrickは、大容量のDWH構築におけるデファクトスタンダードです。大規模なDWHを構築する際の、データベース選定では、トータルデータ件数・日々のトランザクション件数・フロントエンド用のマートツールやOLAPツールなどを考慮して選定する必要があります。特に日々のデータのローディングに関しては、通常のRDBでは限界があります。

RedBrickは、大量のデータローディングに対して高速に処理することができます。このような大規模なデータを扱う場合は、モデリングにもまして、データのクレンジングがポイントになります。これはスターインデックスを扱う上では生命線です。