top of page
自然言語処理
自然言語処理は、日本語や他の日常的な言語をコンピュータで分析する技術であり、プログラミング言語などの人工言語ではなく、自然な言葉を対象とします。自然言語は曖昧で文脈によって異なる意味を持つことがあり、開発には高度な技術が必要です。
自然言語処理には、大きく分けて言語解析(言語理解)と言語生成の2つの処理がある。
言語解析とは、ある言語表現の意味内容をコンピュータでも理解できるよう変換する処理のことであり、言語生成とは、コンピュータの内部表現から言語表現を作り出す処理のことを指します。
ここでは、特に言語解析に関しての基礎技術について下記の通り紹介します。
【1】形態素解析
自然言語で書かれた文を最小の意味単位である形態素に分割し、品詞や基本形などを分析します。自然言語とは、日本語や英語など、プログラミング言語等ではない会話に用いる言語のことを指します。
例えば、英語の単語"cats"は2つの形態素である"cat"と"s"から構成されていて、"cat"は猫、"s"は複数であることを表します。
【2】統語解析
形態素解析によって品詞の情報が得られた形態素を、句・節にまとめ文法的な関係性を明らかにする処理のことです。
【3】意味解析
統語解析で明らかにした形態素同士の文法的関係から、文全体の意味を決定します。ここでは、形態素1つ1つの表す意味を決定する処理と、形態素同士の関係を決定する処理を行うことになります。そしてこれらの情報を整理したものを概念体系、オントロジーと呼びます。
関連コラム
無料で可視化
関連用語
bottom of page