情報
実践・自然言語処理シリーズ 第6巻
クチコミ分析システムの作り方
クチコミの解析と可視化 !!
クチコミとは本来「人の口から口へと個別的に伝えられるコミュニケーション」であり、マスコミとは対極に位置する。それが、ブログや掲示板などのサービスを使うことによって、瞬時にどこまでも伝達可能な新しい情報媒体に進化した。クチコミにはマスコミからでは得られない様々な価値の情報が含まれるが、その多くは未整理で、そのままでは活用が難しいとされる。
本書は、それらのデータを横断的かつ自動的に集約するシステムの構築に必要な技術やテクニックを紹介する。また、そもそもそれらの情報を活用することの意義や、実際の情報集約にあたって役に立つ機能、具体的な分析作業などについても解説する。
電子書籍¥3,850 小売希望価格(税込)
紙の書籍¥3,850定価(税込)
基本情報
| 発売日 | 2019年6月29日 |
|---|---|
| 本体価格 | 3,500円 |
| ページ数 | 208 ページ ※印刷物 |
| サイズ | B5 変形 |
| ISBN | 9784764905917 |
| ジャンル | 情報 |
| タグ | 自然言語処理 |
| 電子書籍形式 | 固定型 |
主要目次
第1章 クチコミ分析の目的
1.1 商品供給者の視点で
1.1.1 商品の分析をしたい
1.1.2 広告効果を測定したい
1.1.3 意思決定材料を整理したい
1.1.4 分析結果を再発信したい
1.1.5 商品改良のアイデアを集めたい
1.1.6 クチコミを効率的に読んで分析したい
1.2 消費者の視点で
1.2.1 購買サポート
1.2.2 意思決定支援・行動サポート
1.2.3 身近な課題の解決
1.2.4 クチコミを楽しむ
1.3 流通・メディアの視点で
1.3.1 商品流通の促進
1.3.2 クチコミ情報の流通
1.4 この章のまとめ
第2章 クチコミ分析システムの構成
2.1 クチコミ分析システムの要件
2.2 典型的な構成
2.3 クチコミ分析サービスの例
2.4 この章のまとめ
第3章 クチコミを収集する
3.1 クチコミ分析の対象とそれぞれの特徴
3.1.1 特定のテーマがあるメディア,テーマがないメディア
3.1.2 対話メディアとモノローグメディア
3.1.3 特定少数に向けたメディア,不特定多数に向けたメディア
3.1.4 匿名のメディア,IDのあるメディア
3.1.5 集中した権利者がいるか,個々人が権利を有しているか
3.2 CGMコンテンツの収集
3.2.1 RSSフィードによる収集
3.2.2 APIによる収集
3.2.3 ウェブクローラーによる収集
3.3 スパムとマルチポストの検出
3.3.1 スパム記事の検出
3.3.2 複製記事の検出
3.4 CGMコンテンツの権利処理
3.4.1 サイトごとにどんな権利タイプがあるか
3.4.2 どんな規定を考慮に入れるべきか
3.5 この章のまとめ
第4章 クチコミの意味表現
4.1 クチコミが生成されるプロセス
4.2 クチコミ情報の構成要素
4.2.1 センチメント
4.2.2 消費者(著者)
4.2.3 対象物
4.2.4 記事
4.3 クチコミ情報要素間の関係情報
4.3.1 消費者と対象物の接触
4.3.2 記事とセンチメント
4.4 この章のまとめ
第5章 クチコミの解析技術
5.1 本文抽出・スクレイピング
5.2 テキストの解析
5.2.1 文分割(文抽出)
5.2.2 形態素解析・品詞タギング
5.2.3 文節抽出・構文解析
5.3 意味のまとまりの抽出
5.3.1 固有表現,タームの抽出
5.3.2 主観表現(評価表現)の抽出
5.3.3 属性の抽出
5.4 抽出辞書の作成
5.4.1 対象物辞書
5.4.2 主観表現辞書
5.5 極性の判定
5.6 同一性の判定(名寄せ)
5.6.1 音が類似した表記揺れ
5.6.2 略語の吸収
5.6.3 別名の認識
5.6.4 属性の名寄せ
5.7 非同一性の判定(あいまい性解消)
5.8 センチメントの構造化
5.9 不適切なクチコミ
5.10 消費者の理解
5.10.1 消費者属性の理解
5.10.2 消費者行動の理解
5.11 この章のまとめ
第6章 クチコミ情報のテキスト生成
6.1 センチメント情報タグの生成
6.1.1 対象物名タグの生成
6.1.2 主観情報タグの生成
6.2 属性集合表現の生成
6.3 クチコミ要約
6.3.1 テキスト要約技術
6.3.2 クチコミ要約の設計
6.4 この章のまとめ
第7章 クチコミを集約する
7.1 集約機能の概要
7.1.1 集約の基本ステップ
7.1.2 集約のためのデータ構造
7.1.3 クチコミ情報テーブルを用いた集約処理
7.2 集約機能を構成する処理の詳細
7.2.1 選択処理
7.2.2 グループ化処理
7.2.3 集計処理
7.3 クチコミ情報テーブルの実現方法
7.3.1 クチコミ情報レコードの動的生成
7.3.2 RDBMSを用いた実装方法
7.3.3 クチコミ情報レコードの格納方法
7.4 集約機能の実現方法
7.4.1 簡易問合せ言語の仕様
7.4.2 選択処理の実現方法
7.4.3 グループ化・集計処理の実現方法
7.5 実現例
7.6 まとめ
第8章 クチコミを可視化する
8.1 分析の目的と可視化手法
8.2 可視化プロセスと対象レコード形式
8.3 特定の対象物に関する定量分析
8.3.1 対象物が単数で時間変化なしの例
8.3.2 時系列グラフの例
8.3.3 複数対象物の比較の例
8.4 特定の対象物に関する定性分析
8.4.1 主観情報の頻度表示
8.4.2 主観情報の関係表示
8.4.3 文や文章による表示
8.5 対象物集合の概観把握
8.5.1 ランキング表示
8.5.2 散布図表示
8.5.3 ネットワーク表示
8.6 可視化ツール
8.6.1 表計算ソフト
8.6.2 BIツール
8.6.3 可視化ライブラリ
8.7 まとめ
第9章 おわりに ~クチコミ分析のレシピ~
付録
A.1 系列ラベリングとチャンキング
A.2 並び順を考慮する要約モデル