データ活用スキルアップ講座を通して、基本的なExcel業務の効率化からBIツールを用いたデータの活用方法まで、身近な業務から大きな視点まで、シリーズを通してデータ活用の流れをご紹介してきました。
今回は2025年1月21日(火)に開催した第3弾!「データを可視化して活用を!」と題したウェビナーの内容をご紹介いたします。
第1弾:「脱Excelで始める業務効率化のはじめ方!」の内容はこちらで、第2弾:「データウェアハウスを使ってチームで業務効率化!」の内容はこちらで、ご紹介しています。
BIツールとは
BIツールはビジネス・インテリジェンスツールの略称で、膨大なデータを集計・分析して可視化(レポート化)することで、業務や経営の意思決定を支援するツールです。
従来は、様々なシステムから取得した様々なデータを表計算ソフトを駆使して一つにまとめ上げ、グラフ化を行い、レポートにまとめてきました。
表計算ソフトでも、ある程度の効率化は可能ですが、人手を介するために、手作業を要因としたミスによる作業の手戻り、それによるデータの信頼性の問題、非効率などの問題があることから、データが最新であれば最新なグラフに自動更新され、インタラクティブにデータを表現できるBIツールでグラフ化、ダッシュボードの作成、データ分析を行う企業が増えてきています。
BIの登場は1900年代になりますが、中央集権的なBIで、基幹システムに溜まったデータのダッシュボード化を経営陣がIT部門に依頼したところから始まります。データからキューブを作り、ダッシュボードを作るかたちでしたが要件定義から入ることから時間がかかるため、あまり流行らなかったようです。第2世代はQlikから始まったセルフサービスBIです。手元にあるデータを可視化して分析するという流れの中で、誰でも使えることを目指しインターフェースなどが工夫され使いやすくなりました。基本的にデータは手元のPC内で扱うことを基本としており、パフォーマンスはPCのスペックにひっぱられます。第三世代はクラウド型のデータウェアハウスをデータソースとすることが前提となっており、クラウドのハイパワーを効率的に使えるような仕組みとなっており、クラウドDWHとの相性が良くなっています。基本的に現在メインで使われているのは第2世代以降のセルフサービスBIが主流です。
実際BIツールの導入はかなり進んでいます。ガートナーの調査によると、74%もの企業でBIツールが導入されています。ただし、利用企業のうち41%は利用していないと回答しており、自身で利用しているのは全体の26%、導入の可否にかかわらず利用していない人は約半数にも上っています。次に、BIツールの課題を見てみますと、第2世代で非常に使いやすくなったBIツールですが、実はその課題トップ3は、教育が必要かつリテラシーの底上げが必要という意見が多くなっています。実際、BIを使いこなそうとすると、どうしてもリレーショナルデータベースのことを理解している必要がある、と言われています。
そのため、BIツールを導入しても自分たちで作るのが難しいので得意な人に依頼する、そして得意な人はダッシュボード職人化する、というスパイラルが生まれています。皮肉なことに、BIツールが広まれば広まるほどダッシュボード作成の依頼は増えてしまいます。これを解決するために、力技でダッシュボード職人を増やす、というケースもありますし、なんとか教育して自分たちで作れるようにしていく、というケースもあります。
この課題を解決し「誰でも使えるBIツール」が「ThoughtSpot (ソートスポット)」というツールです。
ThoughtSpot (ソートスポット)とは
ThoughtSpotはインターネットで検索するようにキーワード検索でデータを可視化でき、専門的な知識がなくても使える点が特徴となっています。また、AI機能がついており、隠れたインサイトを簡単に発見することも可能です。Snowflakeなどのデータウェアハウスと直結することもできるので、明細レベルまでの分析もサポートします。
実際にデモ動画をご覧いただき、イメージしていただければと思います。
さいごに
下の図は、ThoughtSpotとデータウェアハウスのSnowflakeを使ったデータ基盤を構築したときのものとなります。Snowflakeはクラウド型のデータウェアハウスですが、データの読み込み・書き込み処理を行う処理エンジンを自由に追加することができ、負荷に対して非常に柔軟に運用が可能、という特徴があります。
左側の部分はSnowflakeへのデータ蓄積・加工部分となります。ここではETLツールを使う前提での記載となっていますが、様々なデータソースがあっても、それぞれ並行してSnowflakeにデータを集約することが可能です。従来のリレーショナルデータベースでは読み込みも書き込みも同時に行っていると大きな負荷がかかっていましたが、Snowflakeでは処理エンジンをそれぞれ別々に追加できるため、大量のデータがあったとしても、データを活用するユーザーが利用する時間までに簡単にデータを集めることが可能です。
次に、実際にデータを活用する部分ですが、右上のThoughtSpotユーザーがどれだけ多くいても、Snowflake側の処理エンジンを柔軟に展開できるため、ThoughtSpotユーザーの方がデータベース側で待たされる、ということはありません。また、機械学習など高負荷の処理を別で並行で行うことも問題なく対応可能です。
京セラみらいエンビジョンではETLツールからBIツールまで取り扱っており、データの集計・蓄積・可視化まで一貫してサポートしております。データの活用ができていない等課題がお持ちでしたらお気軽にお問い合わせください。