ID-POSデータから気づけなかった 顧客や商品のインサイトを捉える
-グローバル先進事例から学ぶ新たなビッグデータの分析手法とは-

はじめに

大量のID-POSデータを利用する為には、高速なデータ処理が出来るデータウェアハウスと大量な明細データから簡単に分析できるツールが必要です。高性能、高パフォーマンスのアプライアンス製品などありますが、現在の主流はクラウドで柔軟な利用体系が望まれています。また分析ツールも使いやすいだけではなくAIの機能を有しているツールが競争力を高めてくれることは明らかです。本セミナーでは、これらの要望に応える機能を有しているSnowflakeとThoughtSpotをご紹介します。

目次

第1部 「なぜ、今ID-POS分析にThoughtSpotとSnowflakeが必要なのか」
第2部 「検索とAIによるデータ活用の新機軸」~現場の最前線によるデータドリブンな意思決定が組織を成功に導く~
第3部 「データの共有」が導く、小売業におけるビジネス変革
第4部 デモセッション:「数億件のデータを利用した高速・高度なデータ活用からのインサイトを得る」
まとめ

第1部 「なぜ、今ID-POS分析にThoughtSpotとSnowflakeが必要なのか」

講師:株式会社ジール ビジネスディベロップメント部 シニアコンサルタント 岡本 真一 氏

データ分析の課題

データ分析の課題についてお話します。データ分析を行うには、まずデータを使いやすくするために、様々な過程を経なければなりません。そのため、利用者は、すぐにデータを受け取れるわけではありません。データ分析基盤を構築し、いくつかの加工ステップを経て、利用できるようになりますが、その工程はどのようなものでしょうか。一般的なデータ分析基盤のシステム構成図とそのステップについてご説明します。

データ分析基盤には上記の通り5つのステップがあり、またそれぞれの特徴を説明します。

このように<データソースに何があるのか?>から始まって、<データを1か所に集め>、<データウェアハウスを作り>、<BI>の部分までたどり着きます。それから活用するというのが一般的な手順です。この複雑なステップを経て、利用者に分析環境を提供しているため、スピード感が足りないという課題に直面します。

この課題の解決策として、ご提案するのがSnowflakeとThoughtSpotの組み合わせです。分析までの5つステップを3つのステップで実現し、分析までの複雑な手順をシンプルにします。
これによって、数日かかる新規レポートの作成や既存レポートの修正が、短期間で対応できるようになります。

システム全体が複雑になり、分析環境が属人化され、データ活用全体が進んでいないという課題においても、SnowflakeとThoughtSpot で、システム全体をシンプルに使いやすいものにできますので、利用者にも扱いやすい製品で、業務部門でもデータドリブンの推進につながります。

第2部 「検索とAIによるデータ活用の新機軸」~現場の最前線によるデータドリブンな意思決定が組織を成功に導く~

講師:ソートスポット合同会社 シニアソリューションエンジニア 赤栗 雅史氏

ThoughtSpot 概要紹介

ThoughtSpot は、BIツールでありデータ分析、データ可視化製品のひとつです。他のツールと大きく異なっているところは、 Googleのような検索バーの機能を備えている点です。顧客の導入事例としてウォルマートさんをはじめ、グローバルで展開しているいろいろな小売業にも導入されています。

◆⼩売業にはアナリティクスに関する特有の課題がある

小売業のお客様は、他の業種と比べて多種多様かつ大量のデータを色々な業務部門の方々が見るケースが多いと考えられます。POSデータをはじめ、商品単位のデータの活用や、他社とのブランドとの比較、顧客の会員管理、マーケティングのキャンペーン情報などがあります。このように様々な部門で多種多様かつ大量のデータを扱いたいという要望に応えるためには、ThoughtSpot は、とても相性が良い製品ですし、事例も多くあります。

社内のデータ活用の現状として、システム部の方々が現場の人向けに固定のダッシュボードを提供するパターンが多くあります。この場合、現場の方々に使われずに「見るだけ」、「見てくれない」ことも多かったりします。固定のダッシュボードは、そこに表示されている情報だけではわからないような場合、自分たちで調査をしたり、現場の方がツールを使いこなして、レポートを作ったりするケースがあります。しかし、レポート作成が容易に作成できない場合も多いため、データ活用が進まない要因となっています。

Excelでは扱いきれないようなデータボリュームを、誰でも簡単に使えるUIで実現したのがThoughtSpotになります。
その手段として搭載されたのが検索機能です。ほとんどの方が、Google、Yahooを利用して普段から検索されていますが、同じように自社で保有しているデータに対して、この検索バーからアクセスを行い、欲しい情報を得てレポートを作ったり、データを深掘りしていくことができるツールです。

データサイエンティストや分析のスペシャリスト向けの機能と言うよりは、ThoughtSpotに調べさせて、気になる部分がないかを見つけてくれるような使い方ができます。データを見ると、不自然に表示されている部分や、なんでこのデータの売上が増加したのか?といったことをThoughtSpotにまず調べさせるのです。

Spot IQ という機能が分析をサポートするAIエンジンの機能になります。データの中の異常値やトレンドをThoughtSpotに探させて、その結果を表示する機能になります。

ThoughtSpotの検索機能とSnowflakeを組み合わせていただくと、これまで扱えなかったような大量データを現場の方々が簡単に活用できるようになるため、デジタルトランスフォーメーションに役立てられると考えています。

提供形態は、SaaSになっているため、数時間で環境を準備することができます。バージョンアップなどの保守や管理も弊社で対応致します。

第3部 「データの共有」が導く、小売業におけるビジネス変革

講師:Snowflake株式会社 アカウントエグゼクティブ 綾野 誠氏

Snowflakeとは

Snowflakeは、”世界中の価値あるデータの有効活用を支援する”ことをMission Statement (経営理念)として活動しています。ユーザーが価値あるデータを総動員してインサイトを得るためには、データサイロの解消が重要なポイントとなります。
このデータのサイロ化とは?というところですが、小売業であれば、店舗同士の情報や、社内の事業部、部門単位など様々なところにデータが散在していますが、Snowflakeであれば回避することができます。つまりデータを一か所に集めようというコンセプトの製品です。

・幅広い用途:Snowpark(開発者向けにJavaやScalaなどのプログラミング言語へ対応)、データレイク、データウェアハウスなど様々なワークロードをサポート。
・SQL 互換:ANSI SQLを利用し、特別な方言がないため新たなトレーニングをせずに移行が容易。
・マルチクラウド:主要な3つのパブリッククラウドに対応しているため、お客様の希望する環境で展開することが可能。
・SaaS:メンテナンスフリー、自動バックアップ。ダウンタイムも必要ないため運用管理が容易。

真中にストレージがありますが、ほぼ無限のスケーラビリティーを持っています。お客様が使いたい分に応じてスケールできる点が特徴です。現在、世界で1番使っているお客様は、約55ペタバイトのサイズを利用されています。
その次の外枠として、マルチクラスタコンピュートというものがありますが、これはサーバーリソースになります。1つのストレージに対して、無限に接続可能です。その次の外側の枠の部分が、クラウドサービスです。これは、セキュリティを管理したり、データシェアリング の機能を提供しています。

また、Snowflakeの機能の特徴として、コンピューターリソースが、それぞれ競合しないため、別々のワークロードを複数同時に稼働させることができます。その点が多くのお客様の目に留まり、引き合いをいただいています。他社の場合は、シェアードナッシングモデルと呼ばれており、ストレージを増やそうとするとサーバーを増やさなければならなかったりしますが、Snowflakeは、ストレージはストレージ、コンピューティングリソースはコンピューティングリソース
という形で別の管理になっており、必要なリソースだけを増やすことができます。例えば、ストレージを増やさずにコンピューティングリソースだけ事業部ごと、店舗ごとに増やすということができるようになっています。
スケールアウト、スケールインなどもサーバーを止めることなくサイズ変更することができます。

グローバルで4,990を超えるお客様に利用いただいており、業種も様々にわたっています。日本では2019年にビジネスをスタートし、現在は小売や消費財メーカーにとどまらず、様々な業界業種で企業利用が広まっています。一例では、ファミリーマート様、インテージテクノスフィア様などで活用いただいております。

データシェアリング機能

Snowflakeは、ビジネスを変革するデータシェアリングという特徴的な機能を有しています。データを提供するものがデータを利用したいものに対して、セキュアに共有する仕組みです。データ利用者は、自分たちがローカルでこのデータ提供者が持っているテーブルをバーチャルで自分のテーブルとして利用することができるのです。

今まで店舗と本部の点で繋がっていたデータは、Snowflakeを介せば、セキュリティを担保した形でリアルタイムに共有することができます。関連会社、子会社、取引先、共有先など、必要なところに必要な分だけデータを自由に渡すことができます。

また、Snowflakeには、Snowflakeデータマーケットプレイス というものがあります。これはSnowflakeユーザーであれば誰でもアクセスできる機能で、データマーケットプレイス上では500種類を超えるデータが展開され、データの取引ができる仕組みになっています。無償でデータを展開できることはもちろんのこと、データを売買することもできるようになっています。例えば天候の情報を取り込んで、自社内のデータと突き合わせて分析したり、COVID-19関連の調査データを取り込んで、今後の需要予測に活かし、新しいインサイトを見つけるというようなことも容易に実現することができます。

Snowflakeからのご紹介

国内ユーザコミュニティ SnowVillage
https://www.youtube.com/c/datacloud

Twitter クマ太郎が毎日配信

https://twitter.com/snowflakedb_jp

第4部 デモセッション:「数億件のデータを利用した高速・高度なデータ活用からのインサイトを得る」

講師:株式会社ジール ビジネスディベロップメント部 シニアコンサルタント 岡本 真一 氏

こちらがSnowflakeのデータベースの管理の画面です。「データベース」の隣にある「共有」というところを押すと、どのテーブルを誰に見せるのかを設定することができます。「Data Marketplace」は、公開するデータを取りこむ設定など、ウェアハウスが、サイズやクラスタなどの容量を設定するところです。例えば、ここでウェアハウスの作成を押してみます。「名前」と「サイズ」と「クラスタ」を入力すると数秒でウェアハウスが作れます。また、Snowflakeの凄いところとして、一度作ったウェアハウスのサイズをここから瞬時に変更することができます。

下記は、ThoughtSpotからSnowflakeを接続した画面です。こちらでテーブルの結合情報をみることができます。

ThoughtSpotをどのように使うかというところですが、下記の様に「去年」「金額」「中分類」「ドラッグストア」のように気になるキーワードを入力していくだけでデータを可視化していきます。グラフの形式も選択していただくだけで簡単に変更ができます。

次はSpotIQというAIを使った機能になります。
例えば、一番売り上げが落ち込んだ3月と一番売り上げが高かった4月の部分をクリックし、右クリックをします。表示されたメニューからSpotIQ分析を選択します。そうすると、どの項目をAIで分析するのかを選ぶことができますので、必要のない項目は削り、分析に加味させたい項目をチェックします。
実行すると、今チェックした2点を自動的に比較し分析レポートを表示してくれます。
例えば、曜日に対しての売上比較、店舗間の売上比較など文章で気付きを提供してくれます。

ピンボードという機能があります。ピンボート機能とは、検索した結果をダッシュボードに保存する機能です。

トライアル版のご案内

ThoughtSpot」、「Snowflake」のどちらもトライアルが可能です。
1か月間環境の利用が可能ですので、ご興味のある方は、お問い合わせください。

まとめ

いままで大量データの分析には、高スペックのハードウェアが必要でした。また、ハードウェアの設計もデータ量を推定し、調達しなければなりませんでした。しかし、いろいろなものがクラウド化されている現在、データについても対象になっています。使いたいときに使い、使った分だけの料金を支払う。

また、データを活用するためのUIというのは、どのBI製品もExcelのピボットテーブル的なものが多くあります。しかし、ThoughtSpotは、それらとは一線を画し、GoogleやYahooの検索バーで分析をするという製品です。これほどユーザーフレンドリーな製品はありません。ぜひこの2つの組み合わせでお試ししてみてください。

◆ ThoughtSpot の詳細はこちらです。

◆ Snowflake の詳細はこちらです。