ChatGPTの登場以降、ビジネスにおけるデータの利活用は「いかに生成AIを活用するか」という新たなステージに入りました。しかし、どのように生成AIを活用したらいいのか、悩んでいる方も多いかと思います。また、生成AIを活用するためにも、データを整備することは非常に重要です。生成AIの精度を上げるためにも、分析に適した形に整備されている必要があります。本記事では、単なるチャットでその場限りの利用ではなく、データ加工の中で生成AIをどのように活用するか、具体的な活用法をご紹介します。
(2025年11月28日(金)開催ウェビナー「生成AI活用の成否は 「データ」で決まる! Alteryx新機能「GenAIツール」徹底解剖」の内容をもとにご紹介いたします。)
データ分析に生成AIがどのように使われているのか
データ分析というとみなさんどのようなイメージをお持ちでしょうか?
例えば、販売データを使って簡単な集計作業を行い、売上の推移や売上の進捗を見るのも立派なデータ分析ですし、データサイエンティストが行うような機械学習を使うような高度な分析もデータ分析です。このデータ分析の中でどのようにAIが使われてきており、今後生成AIがどの部分で使われるのか、お話していきたいと思います。
AI時代になり、データの品質がますます重要になってきています。「ゴミを入れるとゴミしかでてこない(ガベージイン、ガベージアウト)」という言葉がありますが、これは機械学習やディープラーニングが使われてきた時代からは変わっていないのですが、基本的にAIにはきれいなデータを入れる必要がある、という意味があります。
データ分析とAIの関係について、LLM登場以前を少し見てみてみたいと思います。元々、LLM登場以前から、データ分析の世界では機械学習が使われてきていました。たとえば、収集したデータのうち非構造化データを構造化にするプロセスのところで、ラベリングは機械学習を使ったテキストマイニングで行われていました。いわゆる感情分析や分類といったタスクが行われてきました。その他、分析の部分については、主に機械学習、ディープラーニングがデータサイエンティストの手によって行われてきました。専門的な知識が必要とされ、AIを使うにしてもハードルが高いものでした。
次に、LLMがでてからどうなったかを見ていきたいと思います。まず、データ収集のところで、WEBスクレイピングやPDFからのデータ抽出など、非構造化データの構造化データ化が生成AIの力で簡単になりました。ラベリングも手軽にできるようになり、精度も向上しています。データの準備や集計のタスクでは、生成AIがSQLを生成できるようになったので、多くのBIツールやDWH(データウェアハウス)で生成AIを使ったSQL生成が流行っています。また、手間がかかっていた「名寄せ」がかなり楽になっています。次に、集計したデータをレポートに起こすときに、データを読み解いて要約する必要がありますが、これも生成AIがやってくれるようになっています。さらに、機械学習やディープラーニングは、生成AIがPythonコードを書いてくれるので、かなりハードルは下がったように思います。しかし、ちゃんとやるならやはり機械学習の知識は必須になってきます。つまり、LLMの登場で、より高度化、精度向上、機械学習自体も使いやすくなった、ということです。
これを図にしてみると下記のようになります。
しかし、LLMを使えばそのままレポートが仕上がる、ということはありません。実はLLMは計算が苦手です。LLMは確率論で動いており、人間と同じようなロジックで計算をするわけではありません。また、LLMが利用できるメモリも限られているので、大量のデータを処理できるわけでもないのです。
では、LLMに大量のデータをあたえるとどうなるのでしょうか?
実は、一部のデータを計算したつもりになって、結果として「売上の合計は123,456,789円です」といったデタラメの回答を返してくることが多々あります。一方で、集計した結果を読み解いて要約したり、といったタスクは得意なので、得意な分野でLLMを使っていくのがおすすめです。
ここで、LLMの得意なこと・苦手なことをまとめてみます。
あくまで大規模言語モデルは言語モデルなので、言語に関することが得意です。非構造化データの処理、名寄せ、コードの生成は得意分野となっています。コードの生成はエンジニアの方にはとても助かります。ただ、AIの作ったものはどうしても間違いを含むため、そのまま利用することはできません。出てきたものをチェックしたり、検証する必要があります。このためにはSQL、Pythonの知識が必要になってきます。
苦手なことは計算、集計したりすることです。また、GUIツールの操作は苦手です。ただ、知識としてどのように操作すればいいかは知っているので、言語で操作する方法は教えてくれます。これらの対策として、計算についてはLLMにPythonを使って実行させるか、事前に計算した結果を渡すことで解消可能です。
結論として、AIが高度化されていますが、AIを用いたデータ分析の市民化、というところについては依然としてハードルがある、というのが実態ではないかと思います。とはいえ、確実にデータ分析にLLMが活用されているのは紛れもない事実ですので、今回はノーコードデータ分析ツール「Alteryx(アルテリックス)」でプログラミング知識を使わずに生成AIをどう活用されているかご紹介していきます。
ノーコードデータ分析ツール「Alteryx」での生成AI活用について
今回ご紹介するAlteryxは、Alteryxの得意なところとLLMの得意なところをかけあわせ、お互いの不得意部分をカバーすることが可能になっています。まず、LLMの得意分野を活かしたAlteryx用のツールとして、GenAIツールとAutoInsightsがあります。
GenAIツールはLLMをそのままAlteryxのワークフロー(データ準備・分析の際に作成したツールの設定・組み合わせをファイルとして保存したもの)内で利用できるツールです。一方、AutoInsightsは、定型的な差異比較分析を行い、レポートを自動作成するツールです。LLMと機械学習の機能を使うことで、オートでレポートがでてくるツールです。
LLMの不得意分野はどうでしょうか?
これはAlteryxが得意とする分野で、AlteryxのわかりやすいGUIと強力なデータ準備機能を使って、LLMの不得意分野のタスクをこなすことができます。
実際のイメージとしては下図のようになります。例えば、最近売上が落ちてきているということで、偉い人が「売上が悪い原因が知りたい」とつぶやいた時、AlteryxとAIの機能を使うとどうなるでしょうか?特に今回はAIにフィーチャーして見ていきましょう。
まず要因分析をしなければならないのですが、データさえあればAutoInsightsで一発クリアです。データがなければ、分析するためのデータをかき集める必要があります。次に、かき集めたデータを結合していく必要がおそらくあるでしょう。集計作業などのデータ加工もあると思います。データ量が多ければ、Excelが落ちてしまうことは日常茶飯事です。そしてようやく要因を分析することができます。
それぞれ、データ収集、結合、前処理、それからようやく要因分析といったプロセスになります。
このプロセスのどこでAlteryxとAIが使えるでしょうか?
まず、集計作業のところなどAlteryxで行うのが中心ですが、さらにGenAIツールを使えば生成AIを処理に組み込むことができ、Alteryxに不慣れな人には、使い方の補助という形でAlteryx Copilotが使えます。これがだいたいデータ分析作業におけるAlteryx+生成AIのコンビネーションとなります。
Alteryx(アルテリックス)とは?
Alteryxは、データに接続後、データを加工・集計、さらには高度な分析を行い、データを作ったりレポートを作って結果を共有するソフトです。接続できるデータは、ExcelやAccessデータに限らず、クラウドのデータやGIS、データベースなど様々なデータソースが対象となります。これらを元に集計や加工などデータ準備を行い、さらに必要であれば空間分析や予測分析といった高度な分析を行うこともできます。最終的にはBIツールへのアウトプットやPDFなどのレポート形式、データベースへの反映など、分析結果の共有ということを行っていきます。ここで中心となるのがAlteryx DesignerというソフトでみなさんのPCにインストールして使うようなソフトとなっています。その他にもスケジュール実行機能を持つServer製品などもあります。

特長してGUIを用いたわかりやすいインターフェースが採用されており、ノーコードでデータ処理・分析を行なうことができます。データ分析の専門家がいなくてもデータ分析を始めることが可能になります。操作のイメージは動画にてご紹介します。
Excelを使って分析する際、ファイルを読み込んで、フィルタをかけて、並べ替えて、ソートして、という一連の処理の流れがあるかと思いますが、基本的にExcelの場合は都度手で各処理を行っていきます。一方、Alteryxの場合は、それぞれの処理がアイコンの形になっていて、これらを配置していって、処理の順番を決めて処理していきます。各ツールを並べて線でつなぐことで、処理の順序をはっきりさせて、行われている処理を可視化します。順序立てて処理を行うため、やっていることがわかりやすい点が特徴です。そのため、業務の属人化しにくくなりまた、処理の流れが見えるので、修正や追加というのも簡単にできるようになります。
GenAIツールの活用例
今回新たにAlteryxに追加されたのがこのGenAIと呼ばれるカテゴリです。新契約方式のAlteryxOneであればご利用可能です。また、使用するLLMについては、お客様にて契約して頂く必要があります。基本的にプロンプト(Prompt)ツールがあれば他のツールはなくても問題ありません。このPromptツールは、LLMにプロンプトを投げるツールです。それ以外でLLM Override以外のツールはすべて内部でプロンプトツールを使っており、Alteryx側でプロンプトエンジニアリングを行って、専用の機能としたツールになっています。LLM Overrideというのは、少し特殊で、LLMの設定を行うためのツールですが、プロンプトツールは同等の機能を内蔵しています。
実際にGenAIツールをAlteryxで使う場合、何ができるのでしょうか?
主に非構造化データを構造化データにできます。つまりPDF内のテーブル形式のデータを実際のテーブルデータとして取り出すことができます。また、日本語テキストマイニングが簡単にできるようになります。さらに、Alteryxの強力のワークフロー内に生成AIのパワーを組み込むことができます。
ユースケース①名寄せ
会社名ごとにリストを作成するときに、「○○株式会社」「○○(株)」「会社略称」と同じ会社でも表記方法が異なり、結局手作業で確認が必要になってしまうことがあります。これを「名寄せ」によって表記方法が異なっても同一の会社名だと認識してリストを作成することが可能になります。名寄せといえば正規表現を使った方法や、類似度を計算して行ったりしていましたが、LLMが名寄せを行ってくれるようになりました。Alteryxを使う場合は、3部門の会社名のマスタを読み込ませ、同じものと判断できるものの組み合わせを作らせています。最終的にできたマッチング表を使って、ばらばらだったマスターテーブルの統一化を図ります。ただ、毎回全データをLLMを使うとコストや時間がかかるので、「マッチングテーブルをLLMで生成させ、マッチングしないものがあったときだけ再度生成AIで名寄せして追加していく」、という方法がコストもかからず速度も早いと一石二鳥な方法です。これはAlteryxの強力なワークフロー機能のおかげでこのようなものを作り込むことができます。
ユースケース②名寄せ
会議の文字起こしからの情報抽出です。AI文字起こしツールで会議の文字起こしはやってくれますが、Alteryxの場合、さらに何かのプロジェクト管理ツールへの書き込みをAPI経由で行ったり、DB(データベース)に書き込んだり、といったところまで可能です。単機能で終わらず、システム間連携までできるところがAlteryxの強みとなっています。
ユースケース③分類タスク
アンケートや会社に来ている問い合わせデータの分類などを行うことも可能です。例えば問い合わせデータだと、いくつかの項目はそのまま選択式などで使いやすいデータになっていることが多いかと思いますが、問い合わせ内容はフリーテキストになっていることが多いかと思います。このフリーテキストの内容から、例えば逆営業だったりサポート問い合わせだったりなどの問い合わせ内容のカテゴリの判断、特定の部門、例えば人事部が対応しないといけないかどうかといった対応部門、優先度、概要などをLLMに抽出させ、構造化データにすることが可能です。
ユースケース④感情分析
アンケートや口コミ情報の場合、感情分析を行うことも多いかと思います。レビューデータを感情分析し、自社製品に対して肯定的なのか、否定的なのか分類することも可能になります。
ユースケース⑤エグゼクティブレポート
経営者向けレポートの作成も可能になります。ただ、生データをそのまま渡すとよくわからないレポートが出来上がることがあるので、集計したデータを渡すことが大切です。分析してほしい切り口で集計したデータをいくつか渡せば、その切り口にそって分析を行ってくれます。また、レポートをどのようにまとめるかまで指示すれば、そのとおりまとめてくれるので、プロンプトは結構工夫しがいがあります。
ユースケース⑥WEBスクレイピング
プロンプトツールはWEBアクセスできないので、ダウンロードツールでホームページをダウンロードし、それを読み込ませてWEBスクレイピングを行うことができます。通常AlteryxでWEBスクレイピングするときはHTMLタグを解析して地道に構築していくのですが、LLMを使うと結構おおまかなな指示で欲しい情報が得られることができます。
まとめ
AlteryxとGenAIツールを使うと「非構造化データを構造化データに変換」したり、「日本語のテキストマイニング」、「Alteryxで作成したデータワークフロー内に生成AIの組み込み」が可能になります。いくつかのユースケースをご紹介しましたが、工夫すればもっと様々なことができるようになるかと思います。人間に近い判断も不可能ではないので、うまく使えば幅が広がると思います。
ビジネスではスピードが非常に重要なファクタとなっていると思いますが、そのスピードをAlteryxとLLMを使うことでさらに加速します。ぜひ使ってみてその効果を実感していただければと思います。
資料にて詳細についてまとめておりますので是非ご活用ください。

