2024年度 人工知能学会全国大会(第38回)で発表【内容を説明】
更新日:6月19日
感性AIのメンバーが5月28日(火)から31日(金)に実施された2024年度 人工知能学会全国大会(第38回)で発表いたしました。
発表タイトル
「単語埋め込みを⽤いた⽇本語オノマトペにおける有声・無声⼦⾳の対⽴による⾳象徴の分析」
上記のタイトルで5月28日(火)、一般セッションの「言語メディア処理」セッションにて発表いたしました。
論文はこちら
今回は発表内容を説明します。
はじめに
例えば、重くて大きい物が転がるさまをあらわす「ゴロゴロ」、軽くて小さい物が転がるさまをあらわす「コロコロ」というオノマトペがあります。2つを比べると「ゴ」と「コ」、つまり濁音と清音で違いがありますね。ここから濁音には「重いイメージ」・「大きいイメージ」、清音には「軽いイメージ」「小さいイメージ」があるとわかります。このようにオノマトペの多くには、音象徴の性質があります。
音象徴は人間の身体による感覚がもととなると言われています。音を聞いたときに持つ感覚や、音を言ったときに持つ感覚が、その音に持つイメージのもととなっていると言われているのです。
では身体を持たないAIはどうでしょうか? 今回実施した調査により、AIも音象徴の情報を持つことが分かりました。
さらにAIがどのような情報を持つかについても分かりました。今回はその内容の一部を説明します。
オノマトペ研究や音象徴について詳細に説明しております。
人間の「キラキラ」「ギラギラ」に持つイメージ
今回は調査対象のひとつである「キラキラ」「ギラギラ」に着目します。「キラキラ」と「ギラギラ」はどちらも、明るく光り輝くさまをあらわすオノマトペです。みなさんはどちらに良いイメージを持ちますか?
既存研究(※1)によると、無声子音(キラキラなど)のほうが有声子音(ギラギラなど)のオノマトペより良い印象を持つことが多いとわかっています。つまり「キラキラ」のほうが「ギラギラ」より良いイメージを持ちやすいです。次の例を見るとわかりやすいかもしれません。
「星がキラキラ光る」は優しく綺麗に輝くイメージ【良いイメージ】
「太陽がギラギラ光る」は眩しく不快に光るイメージ【悪いイメージ】
※1……
[Iwasaki 07] What do English speakers know about gera-gera and yota-yota?: A cross-linguistic investigation of mimetic words for laughing and walking
[Pantcheva 06] 日本語の擬声語・擬態語における形態と意味の相関についての研究
AIも「キラキラ」に良いイメージを持つか
AIも人間と同じく「ギラギラ」に比べて「キラキラ」に良いイメージを持つのでしょうか? 感性AIのメンバーはこれを調べました。
「単語埋め込み」とは
調査では「キラキラ」と「ギラギラ」の単語埋め込みが持つバイアスを調べました。単語埋め込み(Word Embeddings)とは自然言語処理(NLP)(※2)で使われる技法のことです。
※2 自然言語処理(NLP)……日本語や英語などの言語をコンピュータで処理する技術
埋め込みとは単語や画像などの複雑なデータをコンピュータが処理しやすいように数値であらわす技術を指します。そして、単語を対象とした埋め込みを単語埋め込みと言います。
単語埋め込みで大切な要素「ベクトル」
「単語埋め込み」で大切な要素がベクトルです。単語を数値であらわすときベクトルに変換します。ベクトルは [0.14, -0.06, 0.31] といったように数値であらわされます。
似た意味をあらわす単語や、似た文脈で使う単語同士では、向きが似たベクトルになります。例えば上の図にある「りんご」と「みかん」は、ベクトルの向きが似ていますね。一方で、似た意味をあらわさない単語「時計」と「りんご」はベクトルの向きが似ていません。このようにベクトルの向きにより、単語同士の関係や類似度がわかります。
今回の調査では、「キラキラ」「ギラギラ」それぞれが「良い」「悪い」のベクトルと、どれぐらい向きが似ているか確かめることでどちらの印象が強いか判断しています。
「キラキラ」と「ギラギラ」どちらが良い印象?
調査には『Word Embedding Association Test(WEAT)』を使いました。『Word Embedding Association Test(WEAT)』(以下WEAT)では、単語埋め込みが持つバイアスを調べられます(※3)。バイアスとは、単語埋め込みが語の意味に対して持つ「偏った見方(みかた)」を指します。
※3……[Caliskan 17] Semantics derived automatically from language corpora contain human-like biases
例えばoffice, business, careerなどに男性的、home, parents, familyなどに女性的というバイアスが、単語埋め込みの中にあると調べられています。
感性AIのメンバーはWEATを使って、「キラキラ」と「ギラギラ」に「良い/悪い」バイアスがどれぐらいあるか調べました。
単語埋め込みが持つバイアスを調べられるWEATでは、「WEAT値」というものが出ます。WEAT値が正か負かで、「キラキラ」と「ギラギラ」どちらが良い印象かわかります。もし0.5など、正の値である場合「キラキラ」のほうが良い印象であることになります。一方、-0.5など負の値である場合「ギラギラ」のほうが良い印象であることになります。
それでは結果を見ていきましょう。
(「キラキラ」「ギラギラ」を含む、合計77~259ペアのオノマトペの結果です。「キラキラ」「ギラギラ」のみの結果ではありません)
こちらが結果です。図の一番下の段にある「良いー悪い」の項目を見ると、横一列すべて赤色、つまり正の値であるとわかります。「ギラギラ」より「キラキラ」のほうが良い印象を与えると言えますね。この結果により、AIも人間と同じように「『ギラギラ』より『キラキラ』のほうが良い印象」という情報を持つとわかりました。
他にも調査によって、「楽しい・美しい・優しい・幸福・穏やか」という情報を「キラキラ」のほうが持つとわかりました。さらに「キラキラ」と「ギラギラ」は、大きさを示す「小さいー大きい」や、重さを示す「軽いー重い」という情報を持ちづらい可能性があることもわかりました。
今回の調査では、「キラキラ」と「ギラギラ」以外にも「サクサク」と「ザクザク」など、合計77~259ペアのオノマトペを対象に分析しています(※4)。また「明るいー暗い」以外にも、「可愛らしいー憎らしい」「嬉しいー悲しい」など合計37個の観点で分析しています。
※4……ただし個々のオノマトペを取り上げて調査しておりません。77~259ペアのオノマトペをまとめて調査しております
この研究は将来どう活きる?
今回のAIを対象とした音象徴の研究が進むと、AIが人間の感性を理解したように振る舞える可能性があります。この研究はコミュニケーション分野やクリエイティブ分野での応用が期待できます。
コミュニケーション分野
研究が進むと、ユーザに寄り添った対応をAIができる可能性があります。そのため寄り添った対応が求められる業務、例えばコールセンター業務、UXライティング(※5)業務などで活用できる可能性があります。
※5 UXライティング……ユーザにとってわかりやすく、心地の良い文章を書く技術
クリエイティブ分野
研究が進むと、AIが人間の感性に沿ったものを作れる可能性があります。例えばネーミングやキャッチコピーです。与えたい印象を決め、AIがそれに沿ったネーミングやキャッチコピーを生み出すといった活用が期待できます。
『感性AIアナリティクス』への活かし方
弊社のサービス『感性AIアナリティクス』には「音韻感性評価」機能があります。この機能ではオノマトペなど、ことばの音の響きに持つ印象がわかります。
今回の調査結果を今後『感性AIアナリティクス』へも活かせる可能性があります。例えば印象項目を増やすことです。今回の調査では「幸福ー不幸」「清潔ー不潔」「ぼんやりーはっきり」など、『感性AIアナリティクス』にはない印象項目の結果がわかっています。今回の調査に加えさらに、単語埋め込み内にある形容詞対どうし(「明るい」と「暗い」など)の関係を比べることで、印象項目を追加できる可能性があります。
また『感性AIアナリティクス』には、文の意味的な印象から評価をする「テキスト感性評価」機能があります。「音韻感性評価」は音象徴的な特徴、「テキスト感性評価」は単語や文の埋め込みの特徴を使っています。そのため今回のような調査により、それぞれの得意な点を理解して適切な利用シーンを判断できる可能性があります。
ただし今回の調査では、対象を有声子音・無声子音のオノマトペに限っているため、応用するにはさらなる調査が必要です。
発表者インタビュー
感性AIの本村へ発表を終えた感想・今後の方向性を聞きました。
人工知能学会全国大会を終えていかがでしょうか?
「人工知能学会全国大会における発表は、感性AI株式会社として初めての試みとなりました。弊社として、オノマトペ研究の発展に寄与できていれば幸いです。」
「オノマトペの音象徴と単語埋め込み空間の関係を分析するという点では、おそらく前例が見られず、分析に対する客観的な反応や関心が未知の状態でした。発表や質疑応答などをとおして我々の考えや姿勢を共有でき、非常に良い機会だったと思っております。」
今後の方向性はどのようなものでしょうか?
「オノマトペ(音象徴)を対象に、埋め込み空間ベクトルとの関係をさらに明らかにしていきたいと考えております。音象徴を生む音韻の特徴をより広範囲に調べたり、埋め込みベクトルのモデル学習など多様な観点で埋め込み空間を分析したり、多言語における対照的な比較をしたりなど、あらゆる方面で貢献していきたいと思っております。」
お問い合わせ
音象徴など人間が持つ情報をAIも持つか、興味を持って研究しております。発表者の本村や弊社へ質問などございましたら、ぜひお気軽にお問い合わせください。
参考文献
[Caliskan 17] Caliskan, A., Bryson, J. J., and Narayanan, A.: Semantics derived automatically from language corpora contain human-like biases, Science, Vol. 356, No. 6334, pp. 183–186 (2017) http://opus.bath.ac.uk/55288/
[Iwasaki 07] Iwasaki, N., Vinson, D. P., and Vigliocco, G.: What do English speakers know about gera-gera and yota-yota?: A cross-linguistic investigation of mimetic words for laughing and walking, Japanese-language education around the globe, Vol. 17, pp. 53–78 (2007)
[Pantcheva 06] Pantcheva, E. L.: 日本語の擬声語・擬態語における形態と意味の相関についての研究, 千葉大学大学院社会文化科学研究科博士論文 (2006)
弊社ではこのような技術等を紹介するメールマガジンを発行しています。
購読をご希望される場合は、Contactページからご連絡をお願いします。
Facebookでも情報更新しています!
Comments