記事情報殿堂入り企業

日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか

日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか

こんにちは、買物情報事業部の荒引 (@a_bicky) です。 前回、「検索結果の疑問を解消するための検索の基礎」で単語単位でインデキシングする前提で説明しましたが、今回は文などを単語単位で分割するために使う技術である形態素解析について触れます。 形態…...

更新日: 2016-05-11
記事の見出し
  • 日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか
  • アジェンダ
  • 形態素解析とは
  • MeCab における最適な解析結果の推定
  • ラティスの構築と最適パスの選択
  • 未知語処理
  • 共通接頭辞検索 (common prefix search)
  • MeCab におけるコストの算出
  • CRF によるモデル化
  • 素性関数
  • モデルから生起コストと連接コストへの変換
  • 最後に
テックブログ情報
日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか
ブログクックパッド開発者ブログ
ブログ概要
QiitaQiita::cookpad
会社名株式会社クックパッド
会社概要国内6000万MAUのレシピ投稿・検索サービスの『クックパッド』を運営しています
上場情報Yahoo!ファイナンス