近代科学社

書籍検索
ジャンル選択

情報

実践・自然言語処理シリーズ 第1巻

言語処理システムをつくる

編集 言語処理学会
著者 佐藤 理史

著者紹介

AI分野で,いま大注目の技術 !!
 AIを考えるとき,「自然言語処理」は常に中心となるテーマである.
本シリーズは,実践的なアプローチで自然言語処理技術に迫っていく.すなわち,最初に具体的なシステムや応用例を示し,それらに関する理論や技術,実装のノウハウは,後からじっくり解説する.
 本書は,著者らが実用化した言語処理システムを最初に提示し,そのシステムをどのように作り上げたかを追体験しながら,設定不良問題などへの具体的な対処方法を紹介している.本書全体をとおして,システム構築に際して,学ぶべき対象と方向性の手かがりが示されている.自然言語処理の開発技術者,研究者,それを志す学生には必携の書である.

電子書籍¥3,080 小売希望価格(税込)

紙の書籍¥3,080定価(税込)

基本情報

発売日 2017年3月1日
本体価格 2,800円
ページ数 144 ページ ※印刷物
サイズ B5 変形
ISBN 9784764905320
ジャンル 情報
タグ 自然言語処理
電子書籍形式 固定型

主要目次

まえがき

第1章 システム事例1: 外国人名のカタカナ訳推定
1.1 システムの実行例
1.2 背景—外来語のカタカナ表記
1.3 解くべき問題を分析する
1.4 システムの仕組み
1.5 学習用データの形式
1.6 アライメントをとる
1.7 外国人名翻訳例データの収集
1.8 システムの各国適応
1.9 この章のまとめ

第2章 システム事例2: テキストの難易度推定
2.1 システムの実行例
2.2 背景
2.3 規準コーパス
2.4 システムの仕組み
2.5 スムージング
2.6 相関係数による評価
2.7 なぜ文字に固執するのか
2.8 BCCWJに基づく規準コーパス
2.9 この章のまとめ

第3章 言語に関する基礎知識
3.1 日本語を客観視する
3.2 言語学の部門と言語単位
3.3 文字から語まで
3.4 語の分類
3.5 文の成り立ち
3.6 単文と複文
3.7 文章の構造
3.8 日本語の特徴
3.9 言語のゆらぎと変化
3.10 この章のまとめ

第4章 形式言語とオートマトン
4.1 言語と文
4.2 正規表現
4.3 形式文法
4.4 正規文法
4.5 文脈自由文法
4.6 有限状態オートマトン
4.7 Finite-State Transducer
4.8 チョムスキーの階層
4.9 この章のまとめ

第5章 言語統計と確率的言語モデル
5.1 n-gram 統計
5.2 二つの経験則
5.3 言語統計の実際
5.4 確率的言語モデル
5.5 この章のまとめ

第6章 システム実装の基礎知識
6.1 文字コード
6.2 よく使うデータ構造
6.3 文字列 照合と置換
6.4 よく使うアルゴリズム
6.5 言語処理ツールと言語資源
6.6 ウェブとの連携法
6.7 この章のまとめ

追補
参考文献
索引

目次をさらに表示する

著者紹介

佐藤 理史(さとう さとし)
1988 年 京都大学大学院工学研究科博士後期課程電気工学第二専攻研究指導認定退学
1998 年 京都大学工学部電気工学第二教室助手
1992 年 京都大学博士(工学)
1992 年 北陸先端科学技術大学院大学情報科学研究科助教授
2000 年 京都大学大学院情報学研究科知能情報学専攻助教授
2005 年 名古屋大学大学院工学研究科電子情報システム専攻教授
     現在に至る
主要著書
『自然言語処理』(共著,岩波書店,1996 年)
『アナロジーによる機械翻訳』(共立出版,1997 年)
『言語情報処理』(共著,岩波書店,1998 年)
『情報の組織化』(共著,岩波書店,2000 年)
『コンピュータが小説を書く日』(日本経済新聞出版社,2016 年)
『Rudy で数独――AI プログラミング入門』(近代科学社,2016 年)

著者紹介をさらに表示する