※ブレインパッドは「Brandwatch」の国内正規パートナーであり、本記事はBrandwatchの許可を得て翻訳転載しています。※翻訳元
ブランドにとって、ソーシャルメディアは消費者のインサイトが詰まった宝庫です。
しかし、ソーシャルメディアデータは膨大なので、効率的な分析によってインサイトを引き出さないといけません。
ソーシャルメディアからインサイトを抽出する主な手法として、テキスト分析や画像分析があります。
今回は、「テキスト分析」にフォーカスしてお話しします。
テキスト分析とは何か
テキスト分析とはテキストから情報を引き出すプロセスを指します。テキスト分析は、ソーシャルメディア、アンケート、掲示板、サポートチケット、通話記録等々、テキストを使っているデータセットであればどれにでも適用することができます。
これまでのコンピューターは、自然言語に存在するニュアンス、主観性、属人性の理解が不得手でした。
しかし、新しい技術や手法によってテキスト分析の精度が大幅に改善されているのです。
もちろん、言語理解の精度はいまだに人間の方が勝っていますが、大量のテキストデータを対象としたデータ処理には、コンピューター技術を生かした自動分析が有効です。
テキスト分析とソーシャルメディアで何ができるのか
ソーシャルメディアデータをテキスト分析することで、消費者やブランド、製品、その他のトピックについて、様々な疑問に対し答えを出すことができます。
下記に、よくある利用例(ユースケース)をまとめてみました。
感情の理解
ブランドや製品、トピックに関して表現された一般的な感情を理解する。
シェアの計測
テキスト分析を使用して、特定のブランド、製品、またはトピックに関する会話の割合を把握します。
主要なトピック、単語、フレーズの把握
会話を掘り下げ、会話のきっかけや時間の経過とともに内容がどう変化したかを理解します。
購買意図の定量化
消費者の購買サイクルにおける購買意図やその他のステージを識別します。
機械学習を利用した全ての疑問への回答
自社のブランドや製品に対し、独自の分析軸で計測したいですか?
そんなとき、機械学習が搭載されたテキスト分析を使えば、独自のカテゴリーを設定し、プラットフォームにルールを学習させ、そのカテゴリーに基づいてソーシャルの投稿を分類することができます。
さて、テキスト分析で何ができるかがわかりましたので、次に2つの主要なアプローチを見てみましょう。
言語学的ルール vs. 機械学習による分析
テキスト分析には、主に2通りのアプローチがあります。
- 言語学的ルール(Linguistic rules)
- 機械学習モデル(Machine learning models)
分析の目的や目標によって、いずれの方法にも一長一短があります。
ユースケースに合わせて適切なアプローチを選択し、インサイト取得の効率化と関連性を高めていきましょう。
言語学的ルール
パターンごとのルールは単純なキーワードの組み合わせや言語の専門家によって長年編集された複雑なモデルに基づくことができます。
言語学的ルールには、会話の構成要素や構文、抑揚の識別、話題、地域、文体のバリエーションに関するものまであります。このルールベースの手法は、迅速に分析を適用することができます。
言語学的ルールのメリット
迅速な分析
いったんルールを設定しておけば、分析には時間がかかりません。
ミスが発見しやすい
ルールがうまく機能している箇所や調査に無関係なデータが返された箇所が容易に判別できます。
細分化した分析
テキストを細分化して分析することができます。
想定通りの結果
ルールに沿った分析では、探していた結果が得られます。
すなわち、より広範な観点に立った結果が得られるというよりは、元々の仮説や前提が再確認されるという場合が多いです。
言語学的ルールの短所
ルールには常に例外がある
言語にはバリエーションがあり、また常に変化しています。ありとあらゆる文字表現を網羅したルールを設定することはいわば不可能です。
したがって、言語学的ルールに基づくテキスト分析では、ルールに柔軟性が欠けてしまうが故に、関連性のある情報を見逃してしまうことがあるので注意が必要です。
複雑なルールは構築に何年もかかることがある
専門家の知識に基づく複雑なルールを構築するために、時間をかけてリサーチし、分析に必要なリソースをまとめる場合もあります。
各言語の詳細な開発
広く研究されていない言語の場合、まず先に文法や語彙に関する固有の特徴を徹底的に研究してからでなければ、テキスト分析ができないケースもあります。
狭いアプローチ
人間がルール設定する場合は、その人の固定概念に沿った想定されるパターンはよく見つかるでしょう。
ルールに依存していると、トレンドや新しい表現が把握できなくなってしまいます。
機械学習
機械学習に基づく分析は、テキスト例からパターンを見出します。統計的手法を使って文書を比較し、最も重要かつ意味のあるパターンを理解します。
機械学習の分析手法には、シンプルなものから複雑なものまでありますが、いずれの場合も、人間が提供する例を基に、最も価値があり顕著なパターンを学習するという基本的なゴールは共通です。
機械学習のメリット
実際の投稿サンプルを使ったトレーニング
よりシンプルな言語的リソースから、調査対象となるカテゴリにとって有益なパターンを学習できる。
カスタマイズや調整可能
機械学習モデルは変更や調整が可能で、予想していなかった新しい条件にも適応できます。
より優れた柔軟性
確立と統計を利用したパターンを適用する機械学習モデルでは、ルール型アプローチでは見逃してしまう重要な文脈(コンテキスト)を把握することができます。
さらなる発見
機械学習モデルは、専門家が想定していなかったような表現の変化を発見することができます。
分析対象言語
新規の言語を分析する場合でも、研究開発に必要なカスタムリソースはほとんどなく、限られた言語学的ノウハウで対応できます。
機械学習の短所
訓練データの必要性
機械学習では徹底した訓練が必要ですが、その訓練によってより関連性の高いインサイトが得られるようになります。
精度の若干の低下
隠れたインサイトが発見できる一方、厳密なルールがないことによる若干の精度の低下が挙げられますが、その代わりに会話における文脈を基にしたインサイトが得られます。
文書の長さとアプローチの選択
(ツイートのような)短い文章と(ブログのような)長い文書とでは考慮すべき点とアプローチが異なります。
柔軟性が重要
どちらのアプローチにも一長一短ありますので、最終的には、分析の目的によって言語学的ルール型と機械学習モデル型の両方を随時切り替えることができる柔軟性が、最良の結果をもたらします。
マーケティングリサーチツールBrandwatchについて
関連記事
・ソーシャルリスニンク゛ならTwitter?Facebook?注目すべきSNSとは
・10年分のソーシャルメディアデータから導く10の考察
・ソーシャルリスニングとは?概要や方法について