データガバナンス/データマネジメントの好循環がDXを成功に導く
~組織作りと組織を活性化するデータ活用基盤の仕組みとは~

2021年11月10日、株式会社ジールにて、『データガバナンス/データマネジメントの好循環がDXを成功に導く~組織作りと組織を活性化するデータ活用基盤の仕組みとは~』セミナーが開催されました。その内容をレポートします。

 

はじめに

企業の競争力はデータを活用出来るか否かによって、今後、大きな差がついていくと言われております。多くの企業では、データ活用の為、専門のDX部門を立上げ、データ活用基盤の本格的な検討をされているのではないでしょうか。全社でデータを活用する為には、データへのガバナンスを高め、データをマネジメントすることが必要となりますが、それに合った組織体制になっている企業は少ない状況です。また、データを活用する組織体制であっても、従来型のシステム基盤では、データガバナンスやデータマネジメントをシステム的に適用、運用することが難しいケースが散見されます。

本セミナーでは、DX成功のカギを握るデータガバナンス/データマネジメントに着目し、どのような組織やデータ活用基盤であれば、好循環がうまれるのかについて、解説致します。

第一部:データガバナンス/データマネジメントが好循環する組織と運営手法

株式会社データ総研 藤生 尊史氏

1.データガバナンス・データマネジメントとは

データマネジメントとはデータという新たな経営資源(データ資産)を適切に管理し利用価値を高めるための継続的な活動のことですが、もう少しブレイクダウンすると、データ資産を管理するデータマネジメントとデータ資産の管理を統制するデータガバナンスの二つに大きく分けられます。データガバナンスでは経営/事業戦略に基づきデータマネジメントを実施するためのルールや基準、体制、業務プロセスを定め、データマネジメントではデータガバナンスで定めたルールやプロセスの遵守状況を日々チェックすると共に、データ利活用のサポートまで行います。

 

現在データガバナンス・データマネジメントが求められている背景として、様々なデータを活用できるようになった一方で、管理すべきデータが増えたことによるリスク増大が挙げられます。既に多くの企業で、データ活用と保護という相反する命題に取り組まなければいけない状態と言えます。


2.データガバナンスとデータマジメントの組織の在り方と役割定義

上の図は、データガバナンスとデータマジメントを実施するための体制を表しています。

データガバナンス組織では企業のデータ戦略における最終的な責任を負うチーフデータオフィサ(CDO)がチーフデータアーキテクト(CDA)と協力し、データマネジメントの基本方針や具体的なルールを定めます。またデータマネジメント組織から受けた報告をチェックすると共に課題の対応方針を定め、データマネジメント組織に指示を出します。

データマネジメント組織では、データガバナンス組織が定めたルールに則り、日々データマネジメントを実施します。データ資産を適切に管理しさらに活用をサポートするためには、業務とデータのエキスパートであるデータスチュワードとデータ品質の責任者であるデータオーナー、データマネジメントのエキスパートであるデータアーキテクトの協力関係が欠かせません。

上記以外にも最終的にデータを活用するまでには、基盤の設定やデータを活用可能な状態にするための前処理など様々な業務をこなす役割が必要です。

・データ活用者は業務目的達成のためのデータ活用施策を検討し、データマネジメント組織へ情報要求を連携します。また、データサイエンティストはデータ活用施策に基づき、具体的なデータ分析手法を検討します。

・データインテグレーターやデータプレッパーはデータマネジメント組織やソースシステムの担当者、データサイエンティストらと連携し、活用データとデータカタログを準備します。

・データクオリティストはデータ品質の測定や低品質データに関する改善案を策定します。また、データセキュリティストはデータの機密性に関する設定やチェックをし、改善案を策定します。

これら多くの役割はあくまで論理的なものですが、重要性の高い新たな業務と捉え相応の体制を作ることと、統制する側とされる側、管理する側とされる側で役割は大きく異なるということを意識して要員配置することが重要です。

 

3.それぞれの部門が直面する課題

データマネジメント側が直面する課題には以下のようなものがあります。

 

また、以下はデータ活用側が直面する課題の一例です。

データマネジメント側とデータ活用側、双方の課題を解決するためのカギとなるのが「データカタログ」です。

・データカタログとはデータそのものではなくデータの付帯情報であるメタデータを一元管理する仕組みのことです。本屋や図書館などにある書籍検索システムの“データ資産版”とイメージしていただくと良いでしょう。

・データ総研ではデータの技術的な側面に関する「アプリケーションメタデータ」(テクニカルメタデータとも呼ぶ)や、業務用語や意味定義、用途や活用におけるノウハウなどを表す「ビジネスメタデータ」、「データ品質」や「機密性」に関するメタデータなど、大きく4つに分類(※)しています。(※メタデータの定義はデータカタログツール・サービスによっても異なります)

 

データカタログをデータマネジメントの中心に据えることで、データマネジメントにかかわる全ての人達が効果的かつ効率的にそれぞれの役割を果たせるようになります。

その一方で、実データとメタデータの両方を閲覧可能なツールやサービスもあるので、不適切なデータアクセスによる情報漏えいなどが起きないように、利便性だけでなく安全性にも配慮したデータカタログ管理が必要です。

また今後は、多様なデータ活用を支えるために活用者間でのコラボレーションを促進する機能が追加されたりメタデータ自体がビッグデータ化されたりするなど、さらなる発展が期待されます。

 

 

 

第二部:“集める”から“つなげる”で変わる新たなデータ統合とデータ管理手法

株式会社ジール 石家 丈朗

1.“集める”から“つなげる”

従来のデータ統合は、物理的に散在する多種多様なデータを“集める”手法を用いていましたが、最新のデータ統合手法は、従来の”集める”だけではなく”つなげる”手法(データ仮想化)を用いることにより、ビジネスの変化に対して迅速かつ柔軟に対応可能なデータ活用基盤の構築を実現しました。

 

下の図は従来のデータ統合手法とデータ仮想化のイメージを表した図になります。

一番下の緑色の部分は、様々なデータソース群です。アプリケーションであったり、データウェアハウスであったり、ファイルであったり。一番上の青色の部分がデータ利用者(フロントエンド)を表しており、様々な形態が考えられると思います。BIツールでデータ分析をする場合、複数のアプリケーションのデータを連携するなど、色々なパターンが考えられるかと思います。これまでは、その過程において、データの複製・加工がおこなわれ、非常にコンプライアンス的にも懸念されるところでありました。俗に言うスパゲッティ状態になっている様子です。

右の図は、“つなげる”というアプローチ、いわゆる『データ仮想化の技術を導入』すると、どんなイメージになるのかを表したものになります。データソース群やフロントエンドは従来とかわりません。その中間層に「Denodo」と呼ばれるデータ仮想化製品を置き、両者を”つなげる”イメージです。

フロントエンドから必要に応じて、シングルポイントでDenodoに接続をすると、Denodoが散在している各データソースから必要なデータを持ってきて、フロントエンドに返す仕組みになっています。この中間層(Denodo)が、あたかも論理的な大きなデータウェアハウス(LDW)になっているというイメージです。昔から課題として挙げられておりますSingle View Of The Truthの実現に大きく貢献し得るソリューションと思っていただければと思います。

 

下の図は、Denodoに関わるデータの関係性を表している情報活用基盤の図です。
赤い点線の中が、Denodoが作用している範囲です。

Denodoの中には、基本的にデータは持ち込みません。データはデータソース層にあるものを都度持ってくるというイメージです。この赤点線枠の中は、基本的には論理的定義のみです。
この赤点線枠の外が、従来の物理的にデータを統合していくオーソドックスなアプローチが記述されています。多種多様なデータソース群からETLツールを使ってローデータを格納するデータソース層、ここからテーブルやビューなどを結合してエンタープライズデータウェアハウス等を構築する統合データ層、そして、統合データ層から更にETLを使い、ビジネスサイドが使いやすいように目的別に切り出したデータマート等を構築するアクセスデータ層。一般的には、このデータマートにBIツールなどを繋げてデータ活用を行うことになります。

データ仮想化は、必要なデータソースに対してまず接続の定義をします。データソースからメタデータをインポートし、基本となるビューを論理的に定義します。これをベースビューと呼びます。ベースビューを加工/結合していき派生ビューを定義し、最終的にビジネスサイドが使えるビジネスビューを定義し公開します。ビジネスサイドはBIツール等を駆使して、このビジネスビューを使ってレポーティングやダッシュボードを作成し活用します。

Denodoはビューを作成すると、数クリックでウェブサービス化することも可能です。既存のアプリケーションとウェブサービスでインターフェースをとることが最小の工数で実現できます。

 

こちらはDenodoの簡単なアーキテクチャー図です。

下の部分がデータソース群で、上の部分がフロントエンドで、中間の赤い部分がDenodoを表しています。

様々なデータが現場サイドで使えるようになったとしても、コンプライアンス上、全てのユーザーが同じようにデータを参照できてしまっては問題です。Denodoでは、集中的に非常に強固かつ柔軟にセキュリティを設定できます。USでは、コンプライアンス対応目的でDenodoを採用しているケースが非常に多い様です。

また多くのビューを定義してしまう事で、どこにどのような情報が格納されているのかユーザーがわからなくなってしまいがちですが、Denodoはデータカタログ機能を搭載しているので、ウェブブラウザ上でセルフサービスで情報を検索でき、ユーザーは混乱しません。

 

まとめ

・物理的に散在する多種多様なデータを、仮想的に統合して使える。

・仮想的に統合することでアジャイルアプローチが可能、ビジネスの変化に対して迅速かつ柔軟に対応できる。

・物理的に統合するアプローチでは工数がかかるため、結果的に開発生産性の向上にもつながる。

・現場サイドはオンデマンドで、Denodoに接続をし、その都度、必要なデータソースからデータを持ってくるためリアルタイムにデータを活用できるようになる。

・ガバナンスの対策や、データカタログによる現場サイドのセルフサービス化の促進などがメリットとして挙げられる。

・Denodoでは多くのクエリー最適化の機能や、キャッシュ機能が標準で実装されているので、パフォーマンス面でも安心。

 

2.セキュリティに関して

上の図は、Denodoのセキュリティに関して表した図です。中央の赤い部分がDenodoです。代表的なプロトコルには全て対応しています。LDAPやActive Directoryで認証させたい場合や、データ転送における暗号化についても標準で対応しております。データの表示・非表示・マスキングの設定もUIベースで容易に設定ができます。監査ログにおいても、非常にきめ細かく取れるようになっています。

 

DXに関するアンケート

下図は、一般社団法人日本能率協会様「日本企業の経営課題2020」のDXの取り組みに関するアンケート結果です。
全体で見ると、5割を超える企業でDXの推進・検討に着手済みです。

DX推進における課題では、8割以上で”人材不足”を挙げています。データ仮想化Denodoは非常に強力な武器ではありますが、Denodoを導入しただけでは、これらの課題がすべてクリアになると言うわけではありません。

 

こちらの図は、データマネジメントとデータガバナンスにおける理想的な体制図を表しています。(データ総研様より提供)

第一部の内容の通り、役割を明確化にした体制を同時に作り進めていくということが非常に重要になってきます。この体制図におけるDenodoプロジェクトの推進方法を、デモンストレーションを挟みながら紹介します。

 

準備フェーズについて

こちらは、準備フェーズについて、データ分析プロセス(CRISP-DM)に沿って説明したページになります。

データスチュワードは、自分たちの会社のビジネスを理解し、Denodoが提供する管理ツールや開発ツールを使い、ストックされているデータが現状で使用可能であるかを把握し、使用できない場合は事前に加工することを判断します。場合によっては、ディープなクレンジングが必要であると判断されれば、物理的にデータを外出ししてクレンジングし、正規化したデータを作らなければならないケースもあるでしょう。データ仮想化を用いる範囲を正しく判断しなければなりません。

 

開発フェーズについて

こちらの図は、開発フェーズの役割を表した図です。

Denodoプロジェクトのアーキテクト(Data Virtualization Architect)は、データアーキテクトと密に連携を取りつつ、全体的な仮想データモデルの定義をおこないます。Denodoプロジェクトの管理者(Denodo Platform Administrator)がシステム構成をまとめてDenodoサーバーのインストールなどを行います。

 

ビューを定義するのが開発者(Data Virtualization Developer)の役割です。
開発者が主に使用するツールとして、Web Design Studioがあります。必要に応じてJAVAプログラマも準備します。開発手法としては、分散型・集中型があります。

 

●デモ Web Design Studio

 

 

こちらはデータカタログのトップ画面のサンプルです。主にユーザー(Business User)が使う機能になります。(画面はDenodo v8 Enterprise Plusのデータカタログ)

 

 

まとめ

データを活用する上では、データガバナンス/データマジメントと社内での役割定義や組織体制は重要課題です。
目指すべき姿を理解すると共に、理想的な体制を理解し、好循環を生み出すデータガバナンス/データマネジメントの運用手法についての解説でした。

また多くの企業でデータ統合プロジェクトを導入検討される中で、基本コンセプトは大量のデータを”集める”から”つなげる”という考え方をご紹介しました。データを論理的につなげて管理するという発想転換をする事で、大量にあるデータにガバナンスをかけ、マネジメントすることが実現可能になります。

データのマネジメントに課題を感じている方、少しでもご興味を抱かれた方など、是非弊社にお問い合わせください。

 

<お問い合わせ>
https://www.bi-online.jp/contact/