屋上屋

屋上で小屋を建てている

われらみなbotのようなもの

 

完全ではないbotを作った/ていた/ている話。

なんとなく語彙から予想できるとおり、上のツイートはドゥルーズ(=ガタリ)のテキストから抽出した語句を適当に構成して作成したもので、「適当に構成する」の部分を、形態素解析マルコフ連鎖による文章生成という形でやってみている(たぶん)。しばらく前にこういうのが流行った時期があったような気がする(今でも @shuumai とかちょいちょい流れてくるし、3 legged oauth で権限を渡すと、自分自身のツイートを読み込んで文章を作ってくれる、みたいなWebアプリケーションもたまに見かける気がします)。つまりは、この世界にまたひとつ屋上屋を架している。

 

実装言語はkotlinで、形態素解析にはkuromoji、ツイートまわりにはTwitter4Jを使った。

github.com

twitter4j.org

さすがにいまさらTwitter4Jで実装するのも…というところはありつつ、他で試した方法でいまいちうまくツイートできなかったので、とりあえずのところ許されたい。

kuromojiはとびきり便利で、たとえこちらが形態素解析のことを深く理解できていないとしても、読ませた語句を適当に分割してくれる。さすがに全部完璧にとはいかないので、手で修正すべき部分も出てくるけれど、さらっと遊んでみる分には十分すぎる。

文章生成に関しては、巷間にあまたある(本当にめちゃめちゃ出てくる)実装を参考にしながらの手組みだが、やっていることは単純で、形態素解析の結果出てくる形態素を3つずつ組にして集めていき、適当な一組を始点と決めたら、あとはその組の3番目の形態素が1番目に来る組を探してきて繋げる、ということを繰り返しているのみ。

形態素を3つずつ組にして集める、とはどのようなことか。たとえば、「無色の緑色の考えが猛烈に眠る」という文を例にとってみよう。この文章をkuromojiの形態素解析にかけると、「無色|の|緑色|の|考え|が|猛烈|に|眠る」と分割される。頭から3つずつ組にしてみるならば、「(無色, の, 緑色), (の, 緑色, の), (緑色, の, 考え), (の, 考え, が), (考え, が, 猛烈), (が, 猛烈, に), (猛烈, に, 眠る)」というリストが出来上がる。このリストだけから文章が出来上がることを想像するのは(元の文章の再現以外には)難しいが、実際にはずっとたくさんの文章を読ませているわけだからこのリストは遥かに長いものとなり、ある組で3番目の語が別の組で1番目の語となっているような組み合わせもある程度生まれてくることとなる。であるから、その度ごとに組を適当に繋げていく、というのもある程度できるわけだ。

こんなシンプルな操作でも、なんとなく文章らしいものが出来上がる(こともある)のは、やってみると素朴に驚いてしまう。

なお、これを本当にマルコフ連鎖と言っていいかについてはあまり自信がないので、曖昧にしておきたい。

実装に関して、よく参照したのは次のふたつの記事。挙げておく。

theray0410.hatenablog.com

qiita.com

 

マルコフ連鎖と言っていいかについてはあまり自信がない」と言った舌の根が乾かぬうちにその話題を引っ張るのだけれど、ドゥルーズマルコフ連鎖には、浅からぬ関係があるらしい。日本語でもいくつか論文が見つかる、たとえば次。

ci.nii.ac.jp

ここで小倉は、「未来における振る舞いが現在の値によって決定される確率過程」とされるマルコフ連鎖という概念が、言語論をはじめとするドゥルーズの哲学においてどのように展開されたかを跡付けていき、同じく(あるいは先んじて)マルコフ連鎖を取り上げたラカンとの比較を交えながら、「その部分的依存性ゆえにカオスに陥ることなく、創造的な意味を生む」「連鎖のその都度に意味が変化していくようなシステム」として要約する。 ここで言語とは、かなり無軌道に展開しうるものでありながら、その実最低限のミニマルな秩序によって整流されるものと見做されていると言ってよいだろう。

上で作ってみたようなリストを思い出し、引き付けて考えてみるならば、リストが前提としてあり、そのいずれの組が選択されていくかの重みづけが無意識、情動、その他の働きによって都度変わっていくなかで、場当たり的に連ねられていくもの、それが言語である、ということになるだろうか。念のため付言しておかねばならないのは、このリスト自体も安定したものではなく、日々学習する中で項目が増減したり重みづけが変わったりするものであるし、あるいは、事故による脳の損傷、痴呆などの病による記憶の解けなどにより、破壊されていくものでもある。カトリーヌ・マラブーの言う「破壊的可塑性」を思い起こしてみてもよい。

 

こうしたことを考えていると、我々の日ごろの発話というのもまた、有限化された言語空間において行われているのだろうというところに(当然ながら)思い至る。自分を取り巻く言語空間というものは、意識していないと信じがたいほどの速さで閉じていくような気がする。そのとき言語は痩せ衰えてしまうということが、とてもよくわかる気がする。

ところで、徹底された貧しさ、ユクスキュルのダニのような世界貧困性についてドゥルーズは高く評価している。そのような貧しさと、紋切型しか存在しないような言語空間の貧しさは、多少似ているようでおそらく全然異なるもののはずだ。でも、それをうまく言葉にすることはできなかった。宿題。