この記事は、2023年11月14日に開催した「データ&AI」時代のデジタルマーケティングの今日と未来|Growth Summit 2023のウェビナーレポートです。
データ&AIを支えるレイクハウス・プラットフォームとは?
DearOne 河野|
皆さん、こんにちは。Growth Summit 2023をご視聴いただき、本当にありがとうございます。このセッションでは、「データ&AI」時代のデジタルマーケティングの今日と未来ということで、ビッグゲストをお迎えして、お話を聞いていきたいと思います。
早速ご紹介します。本日のゲスト、データブリックス・ジャパン笹さんです。本日はよろしくお願いいたします。
データブリックス・ジャパン 笹氏|
こんにちは。データブリックス・ジャパンの笹と申します。私は、データブリックス、とくにデータとAIのプラットフォームを提供しているベンダーで、本年から代表として就任いたしました。去年までは12年間、セールスフォース・ジャパンに勤めておりました。
セールスフォース・ジャパンでも大半の年数をデジタルマーケティングのプラットフォームという部分で仕事させていただいたので、今日は当時の話も交えながら、ぜひいろいろ対談させていただければと思ってます。
DearOne 河野|
よろしくお願いいたします。笹さんはセールスフォースに在籍されていた時代も有名人ですので、ご存知の方も多いかと思います。
申し遅れました。私は、株式会社DearOne代表の河野と申します。本日はよろしくお願いいたします。
最初にデータブリックスさんはグローバルで大変有名な企業ですが、ご存知ない方もいらっしゃるかもしれませんので、簡単に会社のご紹介をお願いいたします。
データブリックス・ジャパン 笹氏|
データブリックスですが、従業員規模はグローバルで5,500名ほど、年間のARRと呼ばれている収益も15億ドルを超えたところです。非常に多くの投資ファンドからも資金提供いただき、今のところ430億ドルの価値があると評価いただいています。
どのようなソリューションを提供しているかというと、「データベース管理システム」と「データサイエンス、機械学習プラットフォーム」という2分野でGartnerからリーダーポジションとして認めていただいています。2分野にまたがってリーダーポジションを持っているのは、データブリックスだけということになり、まさにというところで、私たちのプラットフォームが使われています。
また、APACHE Spark(アパッチスパーク)というものに触れさせていただくと、AI構築を考えるうえでは、教師データというものが重要になります。教師データが多ければ多いほどAIが賢くなるというのが通常です。そうしますと、どれだけの多くのデータを素早く処理できるかということが重要になってきます。
APACHE Sparkというのは、データブリックスの創業のメンバーが生みの親として作った非常に高速にデータを処理できる並列処理のエンジンです。こういったものもデータブリックスのソリューションの中核にあると理解いただければと思います。
私たちのプラットフォームを絵にしてみると、下記のような形になります。
一番下が、私たちのプラットフォームでデータを格納する領域です。ロゴで示している通り、AWS(Amazon Web Services)、Azure(Microsoft Azure)、GCP(Google Cloud Platform)という3大クラウドで動きます。
データプラットフォームの場合、通常はそれぞれのプラットフォームベンダーでデータ格納領域を持ちますが、データブリックスの場合、顧客が契約しているストレージ領域にデータベースを展開するという形になります。
たとえば、DearOneさんが、パブリッククラウドをお使いになっているとします。AWSで考えてみると、S3のストレージ領域を契約される形になると思いますので、そこにデータブリックスが展開されるという形です。従って、データ領域を効率よく扱えて、また、データをプラットフォームベンダー側のコピーするといった手間が省ける分、鮮度を失うことなく、データを管理していけます。
データを管理するなかでは、データのリレーと呼ばれる履歴管理、誰がどのデータを使えるかというガバナンス制御、これはUnity Catalog(ユニティーカタログ)というモデュールで実践して、該当データを使うデータサイエンティストがコラボレーションする、BIデータウェアハウスを動かす、データを加工するデータエンジニアリングをやる、更には、IoT系のストリーミングデータを受け取る。これらを1つのプラットフォームで実現できるマネージドサービスとして提供しています。
上記は公開の許諾をいただいているユーザーの一部です。
たとえば、先日あるイベントではカルチュア・コンビニエンス・クラブのCCCマーケティング様に登壇いただきました。カルチュア・コンビニエンス・クラブ様では、以前から顧客DNAと呼ばれる取り組みをされています。Tポイントカードユーザの行動履歴・ポイント履歴から、そのユーザのライフスタイルをAI(機械学習)で炙り出していくという取り組みです。
顧客DNAの基になるデータはどんどん増えていくので、そのデータ基盤をデータブリックスのプラットフォームに移管いただきました。今後さらに提携等もしてデータボリュームが増えていく中で、AI(機械学習)を動かしやすい環境を作っていただいた形です。
また、IoT領域でもかなりのプロジェクトを実施しています。
たとえば、タイヤで有名なブリヂストン様もひとつです。ブリヂストン様の場合、タイヤの中にセンサーが埋め込まれていて、取得したデータがリアルタイムでデータブリックスのプラットフォームに入ってきて、それを予防保存に活かしていくといった取り組みをはじめ、数々の取り組みをされています。
他にも、AGC様ではイノベーション部という部門で多数のデータサイエンティストを抱え、データサイエンティストの方々が使うプラットフォームとしてデータブリックスを利用いただいています。
DearOne 河野|
ありがとうございます。少し基本的な質問になってしまいますが、御社では、自社のプロダクトをレイクハウス・プラットフォームと表現されているケースが多いと思います。従来のサービスは、データレイクとデータウェアハウスが分かれているケースが多かったと思いますが、御社の場合はデータウェアハウスとしての機能だけではなく、データレイクの機能もあるということでしょうか?
データブリックス・ジャパン 笹氏|
仰る通りです。レイクハウス・プラットフォームは私たちが作った造語で、レイクハウスと呼んでいます。従来は、ログや非構造化データ、つまり画像や映像などを扱うのはデータレイクで、構造化データ、つまり文字・数字などのデータを扱うのはデータウェアハウスという形でプラットフォームが分かれてしまうことが多くなっていました。
しかし、AIの取り組みをやっていこうとすると、構造化と非構造化、もしくは半構造化されたログなどを組み合わせて、AIが回答やインサイトを出していくということになります。結果として、構造化データと非構造化データの2つが一緒に動かないと、AIを上手く使えないということが起こるようになりました。
そこに対応して、非構造化、半構造化、構造化、すべてのデータをひとつのプラットフォームで扱えるようにしたのが私たちの特徴のひとつです。
DearOne 河野|
この時点でシングルソースを実現されていると感じます。
データブリックス・ジャパン 笹氏|
はい。とくにログ系のデータ、たとえば、Webサイトの閲覧ログというのは大半は半構造化データです。しかし、昨今ではヨーロッパのGDPRなどの規制に対応すると、「私の閲覧ログだけを消してください」といった操作が必要になります。
この時、データレイクだと一部分だけ消去することが難しいのですが、データブリックスではこうした対応もすべて可能にしましたので、画期的な取り組みができるかと思います。
DearOne 河野|
よく分かりました。ありがとうございます。
デジタルマーケティングの軌跡とデータ基盤
DearOne 河野|
改めて、ここから「データ&AI時代のデジタルマーケティングの今日と未来」について深掘りしていきたいと思います。まず、デジタルマーケティングの今日に至るまでの軌跡です。
まずインターネットが普及し始めて、SEM(サーチエンジンマーケティング)やブログ、SNSといったものが流行り、次にモバイルファーストの時代に突入して、同時にコンテンツマーケティングがどんどん拡大しました。そして、現在、データ&AIということで、デジタルマーケティングの中にAIという要素が入ってきたという流れです。
ところで、笹さんはデジタルマーケティングの世界に入られたのはいつ頃になりますか?
データブリックス・ジャパン 笹氏|
私がデジタルマーケティングに関わり始めたののは2014年です。2014年6月にセールスフォース・ジャパンにおけるマーケティングクラウド事業部の責任者として内示をもらいました。今でも覚えていますが、そこで大きなイベントを開催して、事業をスタートしました。
当時は、マーケティングオートメーションやOne to Oneマーケティングの元年でした。オラクルさんがOracle Responsys(オラクルレスポンシス)、AdobeさんがCampaign Management(キャンペーンマネジメント)を出していました。
セールスフォースも2013年にExact Target(エクザクトターゲット)というOne to Oneマーケティングのプラットフォームを買収し、1年かけて日本展開の準備をして、2014年に日本でビジネスを初めたというタイミングですね。
DearOne 河野|
当時、日本国内だとOne to Oneマーケティングはかなり先進的な取り組みで、まだ取り組んでいなかった会社が多かった頃ですね。
データブリックス・ジャパン 笹氏|
そうですね。当時は、それぞれのチャネル別にマーケティング施策が取り組まれていました。
たとえば、LINEが登場したのが2011年で、企業別のアカウントが登場したのが2013〜2014年あたりでした。ただ、LINEを導入しても、LINEはLINE、EmailはEmailという形で、チャネル毎に施策が分かれていた時代です。
そうした複数のチャネルを、ひとつにまとめて捉えて考えるOne to Oneマーケティングというのは新しいコンセプトで、マルチチャネルマーケティングオートメーションという言葉が主流になってきた頃でした。
DearOne 河野|
セールスフォースさんが買収したExact Targetさんは米国の企業ですか?
データブリックス・ジャパン 笹氏|
はい、Exact Targetは米国で起業して10年以上の歴史がある会社でした。会社名からして、“正確にターゲティングして施策を展開していく”という意味で、One to Oneマーケティングの先駆けとなる企業でした。
DearOne 河野|
次にデジタルマーケティングの中身、裏側をどんなシステムでやっていたかという部分に入っていきます。
過去はメールなどを顧客別に出し分けするような機能もありませんでしたので、データベースに蓄積した顧客データを使って、全員に同じ内容を配信する一斉配信が実施されていました。
現在はデータをより細かく分解し、蓄積した購買データや行動データを顧客IDに紐づけて整理・分析することが出来るようになったことで、One to Oneマーケティングの時代になっています。
ただ、今後はこれだけでは足りない時代に突入したと感じています。それが次世代のデジタルマーケティングです。
アフターコロナの次世代デジタルマーケティング基盤
データブリックス・ジャパン 笹氏|
私が2014年にデジタルマーケティングの分野に関わり始めた当時は、各チャネルで一斉配信していたところから、自分たちでデータを分けるような形で、クロスチャネル、マルチチャネルでの配信という考え方が入り始めた頃です。
私がセールスフォース・ジャパンでCDPのサービスの提供をはじめたのが2020年頃です。この頃には基幹システムもしくはDWH(データウェアハウス)系のシステムからCDPにデータを取り込む、そして、CDPでセグメンテーションを実施したり、インサイトを分析したりして、それを踏まえて、エンゲージメント領域でモバイルにプッシュ通知したり、SNSやLINE等でリーチしたりするのを制御していくという構成が非常に多くなりました。
DearOne 河野|
セールスフォースさんのマーケティングクラウドは、スライド一番右の「つかう」の配信、エンゲージメント部分に対応しているものですね。
データブリックス・ジャパン 笹氏|
はい、CDPからずっとやっていました。ただ、セールスフォース・ジャパンに在籍していた2021〜2022年ごろから徐々にお客様に求められる要件が変わってきました。
たとえば顧客情報を見て、そこから顧客別のLTV、つまりCLV(顧客生涯価値)を高めていくために商品レコメンデーションやキャンペーンレコメンデーションをやっていくという流れがあります。これを「リアルタイムで実施する」ということを意識する方が多くなったのが2年前ぐらいからだと感じます。
背景として、コロナ禍でずっと家にいた顧客が徐々に実際の店舗に来店されるようになってきた。また、技術が発展したことで「来店した方が誰か?」ということをビーコンやジオフェンスなどで把握できるようになったことがあります。
こうした中、実際の店舗に来店した際の商品レコメンデーションを考えると、たとえば、渋谷、恵比寿、丸の内、それぞれの店舗で在庫の状況が変わってきます。
ECサイトで商品レコメンデーションをする場合、在庫という要素はあまり意識しなくてよかった形です。しかし、実際の店舗では、そのお店で売り切れてしまっていたり、品薄になってしまっていたりする商品をレコメンデーションとしてモバイルに飛ばしてもあまり意味がありません。
それどころか、顧客が「この商品は良いね」と思って来店したのに「申し訳ありません。売り切れています」という状態だったら、むしろ逆効果になってしまいます。このようにリアルの店舗が絡むことで、お客様からの要件が非常に高度になり始めた形です。
しかし、CDPで扱っているのは顧客の購買履歴や閲覧履歴などの情報で、一方で、在庫情報はDWHや基幹システム側で持っているというデータ構成ですと、上記を実現することはかなり難しくなります。
DearOne 河野|
なるほど。データが高度化して、さらにオフラインで施策を展開する、とくに来店中に商品レコメンデーションしようと思うと、高速にデータ処理していかないと実現できないですね。
データブリックス・ジャパン 笹氏|
「顧客インサイトの分析」と書いてしまえば一言になります。ただ、実際に非常に多くのデータ、たとえば、モバイルのログ、Webの閲覧履歴、購買履歴などをまとめて瞬時に解析して、一人ひとりの顧客に対してどういうアクションを起こせばいいかをAIが判断するという流れをやろうと思うと、非常に高速での処理が要求されます。データの量や要素が増えたことで、このあたりの対応が難しくなり始めたのが去年ぐらいかと思います。
DearOne 河野|
デジタルマーケティングの裏側のシステムも進化しています。実際に次のスライドのようなデータスタックを既に実現されている企業もありますか?
データブリックス・ジャパン 笹氏|
はい、あります。後ほど、アメリカの企業事例を紹介したいと思います。
先ほど申し上げたように、たとえば、商品の在庫情報はDWH側にあり、顧客の行動履歴はCDP側にあると、在庫を加味した商品レコメンデーションは難しくなります。
一方で、冒頭でレイクハウスの話をした際にも触れましたが、データブリックスのプラットフォーム上であれば、基幹システムのデータから、顧客データ、顧客のログデータまで、非常に大量のデータを一元管理できます。さらに必要があれば、顧客の写真といった非構造化データも入れることができます。
顧客の写真データを入れられることで、たとえば、1年前と現在の写真をAIが比較分析して、「少し色黒になった」とか「少し太ってきた」ことも分かります。こうした情報も加味してデータを管理して、AIがスコアリング等をかけていくことができます。
たとえば、チャーン(離反)分析で、離反要素が高い顧客はスコアリングを高くして、積極的にキャンペーンにつなげていく。こういったこともAIで実現できます。
従来の「データを格納してセグメンテーションする」というやり方における元データはファクト中心のログデータでした。そこにAIがつくり出すスコアリングも加味して、デジタルマーケティングにつなげていくことが出来るようになった形です。
ただし、こうしたデータをCDPにコピーするとなると、やり取りするデータボリュームが増え、どうしても時間がかかり、データの鮮度が落ちてしまいます。
DearOne 河野|
私から説明したいと思いますが、昨今コンポーザブルCDPというツールが流行り始めています。
笹さんから説明いただいた通り、CDPとデータウェアハウス、レイクハウスプラットフォームが共存してしまうと、同じデータが2か所にあるという形になり、データを同期させるのにコストがかかってしまいます。それをシングルソースという形で実現できるようになったのがコンポーザブルCDPになります。
弊社では、図にあるHightouch(ハイタッチ)というサービスを推奨していますが、データブリックス・ジャパンで出資もされている企業ですね?
データブリックス・ジャパン 笹氏|
はい、1か月ほど前にDatabricks Ventures(データブリックス・ベンチャーズ)が出資をしました。今後Hightouchとの共存環境の構築、協業がより進んでいくと思います。
DearOne 河野|
ありがとうございます。Hightouchに関する詳しい説明は割愛しますが、単純に説明すると、データブリックスさんに溜まっているシングルソースを基に、そのままマーケティングオートメーションツールや分析ツールにデータを渡すことができるツールです。
このような次世代のデータスタックを既に活用している企業事例も後ほどご紹介いただきたいと思います。
データブリックス・ジャパン 笹氏|
私も昨年までデジタルマーケティングの領域で仕事をしていましたが、まだ当時はコンポーザブルCDPの概念はきちんと理解できていませんでした。
データブリックスに入社して、また、Hightouchというツールを知って、2つを組み合わせると、すべてのデータをデータブリックスのプラットフォームにシングルソースとして格納して、その上にセグメントを切るようなオーディエンスビルダーも機能としてある。
常にデータはひとつのデータベース上にあるという環境ができて、そこで選んだデータが、たとえば、私がセールスフォース・ジャパンでやっていたマーケティングクラウドのデータエクステンションと同期を取れる、ジャーニーにデータを入れられる、そうした環境を構築できると気づき驚きました。
私がHightouchを河野社長からご紹介いただいたのが、2ヶ月ほど前です。その1カ月後にデータブリックスが出資したということは偶然でした。
米国における次世代デジタルマーケティング事例
データブリックス・ジャパン 笹氏|
今回、米国での活用事例を準備してきましたのでご紹介します。
ペットスマートという企業です。ペットショップ、また、ペットグッズやケアの提供など、ペットの育成に関するビジネスをされている企業です。
パーソナライズというと顧客自身の情報が第一に連想されますが、ペットを飼われている方にとっては、ペットは自分の分身のようなものです。
ペットスマートは、ペットの状況も加味したうえで、ペットホルダー、つまり飼い主の方々にさまざまなデジタルマーケティングを仕掛けて、CLV(顧客生涯価値)を大きく伸ばしたという事例です。
スライドは、先ほど紹介した次世代のデジタルマーケティング基盤の図と似ていますが、ペットスマートさんが実際に運用するCutomer 360のアーキテクチャ図になっています。
左側のTeach Stack(テックスタック)は一番上にデータブリックスのロゴが載っています。その下にあるMLflow(エムエルフロー)やAPACHE Spark、DELTA LAKE(デルタレイク)などは、データブリックスのプラットフォーム上で動くモデュール群で、これがマネージドサービスで提供されています。従って、Teach Stackの領域は、ほぼそのままデータブリックスだと考えていただくとよいでしょう。
その右側にあるData Products(データプロダクツ)というところが、Hightouchを導入している部分です。
また、中央のCustomer 360の下に図がありますが、カスタマーAとBの状況、ファクトデータ、さらにAIが割り出してくる情報をもとに、右側にあるObjectives(目的)を達成していくという流れです。
たとえばリテンション、離反を防ぐということであったり、それぞれのペットホルダーの状況に合わせたパーソナライゼーションアプローチをする、それをデジタルチャネルを駆使して実施されています。
たとえば、カスタマーAとBという形で例を出していますが、カスタマーAは犬と猫の両方を飼っている、また、最近の購買状況がどうなっているか、右肩上がりなのか下がっているのか等々も判別していきます。
購買傾向を判別するためには、ある一定期間をモニターして購買額を比較していくわけで、それをするためにはインサイトのロジックが動く必要があり、データスタックが重要になってきます。
また、カスタマーAはECで買う方が多く、カスタマーBはショップに来店する方が多い。また、ペットグルーミングをやっているかなどの行動履歴を見て、さらに傾向値を見て、そもそも飼っているのが犬と猫なのか、犬だけなのか、それとも犬と熱帯魚なのかといったことも踏まえて、右側のObjectives(目的)につないでいくということをされています。
これはペットスマートさんの運用を、もう一段詳細に表したスライドです。
カスタマーセグメンテーションをやる上では、当然、先ほど紹介したようなプロファイルをデータとして持っています。その中で、お客様の状況や行動を全部分析し、チャーン(離反)の可能性が高いかといったことも予想して、可能性が高いようであればスコアリングしてキャンペーンを案内する、逆にチャーン(離反)の心配がないようであればCLVをあげるようなアプローチをしていきます。
パーソナライゼーションを考えるとき、コンテンツの領域に話が向かいがちです。しかし、本来、パーソナライゼーションには3つの要素があります。コンテンツのパーソナライズ、タイミングのパーソナライズ、そしてチャンネル、モバイルなのかEメールなのか等々の組み合わせです。
その中で、コンテキストを見つけていきます。たとえば、飼っているのは犬か猫か熱帯魚といったコンテキストの中で、複数飼っている方には、潜在的な購買可能性を踏まえてディスカウント額がより大きくなるようなキャンペーンを案内するといったことを、AIの機械学習の中で割り出しながらオファーの中身をパーソナライズしていきます。
DearOne 河野|
データスタックを構築されているから、そうした分析や施策をスピーディーに回せるわけですか?
データブリックス・ジャパン 笹氏|
仰る通りです。データスタックを構築しているからこそ、かなり高速に回せます。
スライドの左側にある情報は基本的にファクトベースです。たとえば、ECでどれだけ買っているのか、もしくは店舗に来店して買っているのかといったこと、また、最近はペットの健康管理といったことまでやっていますので、そうした情報が全て入ってきます。
その中で、リアルな店舗などがある場合に重要になってくる要素がリアルタイム性です。店舗での購買情報はPOSにデータが溜まりますが、そのタイミングが1日に1回だとすると、「あるタイミングを捉えてキャンペーンを送る」といったことは出来ません。
しかし、「顧客が来店した際に買った商品を判別して、店舗の中にいる間、帰ってしまうまでに何らかアプローチのアクションを起こしたい」となると、相当なスピードでデータを入れて処理する必要があります。
POS連携のリアルタイム性も必要ですし、データボリュームも大きくなります。その中でセグメントだけを割り出すのではなく、CLV、カスタマー別のグロスの購買情報の分析までしようとなると、本当に高速でデータ処理できるプラットフォームが必要になります。
さらに、重要になってくることは顧客の行動情報だけを見ていればよいのかという問題です。②のコンテクストで表現されているのは、飼っているのが犬か、猫か、熱帯魚か、また、1匹か複数かなど、顧客側のコンテキストです。
図には書かれていないのですが、顧客側のコンテキストと同時に、販売する企業側にもコンテキストがあります。たとえば、類似の商品をレコメンドするとしても、新商品を売り込みたいタイミングなのか、在庫になっている前世代の商品を売り込みたいタイミングなのかといったことが企業側のコンテキストです。
顧客側のコンテキストに加えて、こうした企業側のコンテキストも加味しながら、アプローチにつなげていくとなると、一連のデータスタックが全部掌握している必要があります。
スライドの右側にあるエンゲージメント側、⑤のところには私の前職、セールスフォースのロゴがあります。
ここにデータをコピーして動かしていく形ですと、リアルタイム性が失われてしまいますので、Hightouchが必要となるわけです。
今回、米国の事例を持ってきましたが、日本でも今から取り組まれる領域であり、期待されているマーケターの方も多いかと思います。
DearOne 河野|
とても面白いです。ありがとうございます。なお、基本的な事項を確認し忘れましたが、ペットスマートさんはペットショップで、また、グッズなどを売っていて、店舗もあれば、ECサイトもあるという形ですね。
事例をうかがって、さすがに進んでいますね。日本国内で、ここまで出来ている企業というのはありますか?
データブリックス・ジャパン 笹氏|
現場のモバイルとの連携、たとえば、来店時にビーコンで察知する、もしくはモバイルアプリケーションのQRコードでチェックインしてもらって、店舗内にいる間に何らかのアクションを起こすというのは既に取り組まれ始めていて、既に実施している小売業の企業はあると思います。
ただ、顧客データを管理するプラットフォームと基幹システムが分かれて存在してきたという歴史がありますので、それをシングルソース、本当のSSOT(Single Source of Truth:信頼できる唯一の情報源)で、データコピーを極力少なくして実現されているという事例は、また私も存じ上げないですね。
DearOne 河野|
ここまで出来ると、リアルタイム性も加味されて、コストもあまり変わらない形で実現できるんですか?
データブリックス・ジャパン 笹氏|
コストは逆に安くなります。理由は2つです。まずデータコピーをすれば、たとえば、10GBで済んでたデータ量が20GBになりますので、どうしてもストレージコストが増えます。
また、データブリックスのプラットフォームには、APACHE Sparkという非常に高速処理するエンジンがあります。それによって、今までデータ加工に100時間かかっていたものが10時間で終わる、1/10で済むことも多いです。クラウド環境では、コストの大部分はコンピュート処理で課金される形ですので、コンピュート処理が10分の1に減れば必然的にコストが安くなります。
DearOne 河野|
これはぜひ取り組んだ方がよいですね。
データブリックス・ジャパン 笹氏|
今まで各企業が基幹システムと顧客データを別にしていたのは、その方が取り組みやすいといった事情もあったわけです。
しかし、アフターコロナになり、店舗とECのどちらも重要で、ハイブリッドなサービスが顧客から期待されるようになったことを踏まえて、もう一段上のマーケティング施策ができる環境を作っていく企業が増えていくと思います。
いま求められるモダンデータスタックとは?
DearOne 河野|
これまでの内容と重複する部分も生じますが、最後に笹さんからモダンデータスタックの全体像を改めて説明いただけるでしょうか。
データブリックス・ジャパン 笹氏|
口頭でお伝えしてきたモダンデータスタックを1つの図としてまとめると、スライドのようになります。
SSOT(Single Source of Truth:信頼できる唯一の情報源)という言葉は、非常に多く語られてきましたが、そもそもデータの種別というのは大きく4つに分けられます。
1つ目がシステムオブレコード、いわゆる基幹業務データで、在庫管理から販売履歴までのデータです。次がシステムオブエンゲージメント、顧客との接触履歴、たとえば、モバイルアプリケーションの利用履歴やWebタグから入ってくる情報です。3つ目は機器を販売されている企業が中心になりますが、IoTのデータです。最後が外から購入するデータで、たとえば、位置情報や天気情報などです。
この4種類のデータが、ひとつの環境に入ることで、企業側は次のアプローチを起こせる形になります。
たとえば、自動車で考えてみましょう。現在、自動車の走行情報やバッテリーの状況というのは、自動車メーカーにずっと送られています。そして、しばらく自動車を使わないと、モバイルアプリケーションに「バッテリーが上がってしまいますので、運転してください」というメッセージがきます。
私が持っている車の車種、私の属性情報、そして、IoTによる走行情報などのデータが統合されることで、モバイルアプリケーションにアラートが来る環境が実現しているわけです。このようにデータを一元化することに価値があります。
一方で、「バッテリーが上がってしまいますので、運転してください」というメッセージを送る際、私が住んでいる場所にちょうど雨が降っている可能性もあるわけです。
そうした時、天気情報を掛け合わせることで、メッセージの最後に「ただ、今日は雨だと思います。明日までバッテリーは持つと思いますから、晴れた日に忘れずに運転をお願いします」といった一言を入れることも可能になります。
私が去年まで実施していたCRMとマーケティングのソリューション、コールセンターなどの情報も取り込みつつ、ソーシャル、位置情報、天気情報、サードパーティーから購入したデータなどを組み合わせて、このレイクハウス・プラットフォームで一元管理できます。
さらにデータブリックスのプラットフォームでは、データを加工するところまで可能です。ブロンズと呼んでいる生データが入ったら、それを加工してシルバー化する。最後に、データを消費するコンポーザブルCDP、ビジネスインテリジェンス、ビジネスアプリケーションなどが使いやすい形式に加工(ゴールド化)することまで一連の流れで実施できます。
また、最終的にゴールド化されたデータを見るときに意外と困るのが、「このデータはどのファイルから生成されたか?」が分からないことです。データリネージュと呼ばれるものですが、データブリックスのプラットフォームでは、データ加工の履歴管理もされていますので、きちんとデータの系統を辿ることもできます。
また、データブリックスは、図の下側にあるAzure(Microsoft Azure)、AWS(Amazon Web Services)、GCP(Google Cloud Platform)の三大クラウドのどこかで動かしますが、実際に導入しようとすると、「データはAWSにあります、もしくはAzureです。ただ、一部のデータはGCPに残したままです」という場合も十分ありえます。
このような時、以前であればGCPからAzureにコピーしてシングルソースにすることが必要でした。しかし、今年の機能拡張で他のクラウドにあるデータも取得してメッシュ化できるようになりました。
たとえば、「Webログの情報はGCPに置いてある」という企業は意外と多いですが、このように複数のクラウドを組み合わせて、AIを動かしていくことも出来るようになりました。
DearOne 河野|
データブリックスさんは、かなりの速度で進化されていますね。
昔から「サードパーティーデータはうまく使ったほうがいいよ」ということで利用にチャレンジしている企業はかなりあったかと思います。しかし、CDPの話と同じで、ストレージが別で、シングルソースになっていなかったケースが多かったですね。やはり現在だと、ここまでシングルソースにする必要があるということですね。
データブリックス・ジャパン 笹氏|
そうですね。先ほどは触れなかったのですが、データ共有という点では、データブリックスのなかにはDelta Sharing(デルタシェアリング)という機能があります。
たとえば、自動車の事例に含まれていた天気情報はウェザー系のサイトで提供されている形になります。この時、データプロバイダーにデータシェアリング機能を使ってもらえれば、データを使う側のお客様にデータをコピーして渡さなくても使えるようになります。
このように企業をまたいだデータメッシュの環境で機械学習を動かしていくということも可能になります。
マーケティングというテーマからは少しずれますが、需要予測などをするときには非常に効力を発揮する機能です。たとえば、ある商材では人流が重要になる、他の商材では天気が重要になるので、それを扱うSKUカテゴリで、特徴変数の重みづけをモデルで変えていくことをされています。
CLVを高める、グロースを図る中での顧客分析でも、このようなAIの要素、外部データの要素というのは活用できると思います。
DearOne 河野|
たとえば、東京ドームで有名アーティストのコンサートがあると色々なビジネスチャンスにつながるという話はよく聞きますが、こうしたデータをリアルタイムで取得して活用していくということですね。
データブリックス・ジャパン 笹氏|
はい。イベント情報はよく使われる外部データのひとつですね。
まとめ
DearOne 河野|
ありがとうございます。本当に勉強になりました。最後にここまでの内容をまとめさせていただきました。
DearOne 河野|
まず、今後のデジタルマーケティングは、Data&AI+GrowthMarketingが主流となり、実施には消費者の環境情報のデータが必須になります。
そして、参照するデータは今まで以上に多様化・多量化し、リアルタイムにデータ処理、特徴データ化、モデル構築ができるプラットフォームが必要になります。まさにデータブリックスさんがおすすめです。
また、データのバッチコピーが発生する環境をなるべく避けて、データエンジニアリング、AI、デジタルマーケティングにおける一気通貫のプロセスを構築することも必要です。
一気通貫のプロセスを構築する上では、組織的にはどのように対応することが必要になってくるでしょうか?
データブリックス・ジャパン 笹氏|
デジタルマーケティングに力を入れている企業は、CX部門を作って横ぐしにするという流れを実施している組織が多くなっています。
IT側とうまく強調しながらシングルソースを作っていく、顧客データと基幹DWHが分離しない環境を作っていくというのは、横ぐしの部門があれば比較的やりやすい部分ではないかと思います
DearOne 河野|
ありがとうございます。本日の内容、ぜひ視聴者の皆さまにも会社で実践して頂ければと思います。笹さんありがとうございました。最後に一言メッセージをいただけますか。
データブリックス・ジャパン 笹氏|
本日はありがとうございました。データとAIを組み合わせてマーケティングの施策を高度化するという取り組みに関して、実施できることは急激に増えてきていると思います。データブリックスでも、より早く、また効率的にプラットフォームを提供して、ご支援していければと思っています。本日はお招きいただき、本当にありがとうございました。