1. HOME
  2. 刊行物
  3. 金融ITフォーカス
  4. カテゴリから探す
  5. 数理の窓
  6. 「言語ゲーム」を高次元空間に実現する

「言語ゲーム」を高次元空間に実現する

2017年12月号

外園康智

『2人がチェス盤に向かっている。チェスをしているようにみえる。しかし、実際は、悲鳴や足踏みに対応して、駒を動かしているのかも知れない。・・(中略)・・そんなはずがないと思うだろうが、私たちは常識や経験をもとにしているだけで、2人が別の「ルール」に従っている可能性を否定できない。』

 これは、ウィトゲンシュタインの後期哲学「哲学探究」の一節を元にしている。彼は「他者への命令」「しりとり」「演劇」など言語活動全般を「言語ゲーム」と呼び、その本質は、自己や他者への働きかけとした。そして、言語の意味は、人々の間に共有された慣習内の文脈や使い方によって決まるものと考えた。つまり、他者と“会話が成立”するのは、言葉の指す事実が両者で一致しているからではなく、語の用法が共有されているからだ。

 これは、彼の前半の哲学「世界は事実からなり、言語はその写像」、「文の真偽は、実世界の対応している事象で決まる」を否定している。そして「言語は世界の写像」VS「言語ゲーム」の違いは、自然言語処理の手法にも表れる。

 後者に対応した“パラグラフベクトル”と呼ばれる手法がある。これは、単語同士や文同士の近さを測るのに、2つが同時に出現する文や文書の頻度データを使う。たくさんの文書をAIに学習させると、300次元のベクトル空間(※1)ができる。各単語はベクトル空間上の1点になり、2つの単語間の距離を計算することで、意味の近さを測ることができる。例えば「スマホとPCの類似度は0.7」や「砂糖=醤油-しょっぱい+あまい」という関係が成立つ。つまり、単語の意味は、その点の絶対位置でなく、他の単語や文との相対関係においてのみ説明できる。学習文書によってAIのベクトル空間が変わるように、人間一人一人も脳に各々のベクトル空間を持っており、言語ゲームを共有する2人は、それが似ていると言うことができる。

 一方、前者の「言語は世界の写像」の手法は、単語や文を論理式に変換し、論理形式の集合として言語を扱う。単語や文を、論理演算という代数構造を持つ空間にマップするともいえる。この中で言語の意味は“確定”している。多くの知識を空間に入れていけば、推論や文の真偽が決定できるため、システム処理に向いている。2つの手法は相補的だが、現時点での融合は難しく、大きな研究課題だ。

 ちなみに我々は、会社やプライベート、趣味、ネット内など様々な“言語ゲーム”を移動しながら生きている。それぞれに“私”がいるのだが、果たして、それらが同一の“私”であるのは自明なのだろうか?

1) 300次元である必然はなく、モデルの作り方に依存する。学習モデル作りには深層学習を使う。

※組織名、職名は掲載当時のものです。

印刷用PDF

Writer’s Profile

外園康智Yasunori Hokazono

金融デジタル企画一部
上級研究員

この執筆者の他の記事

外園康智の他の記事一覧

このページを見た人はこんなページも見ています