« テレビとネットは相性が悪い? | トップページ | 今週のニュース(7/24~7/30) »

2005.07.29

言語解析とデータベース

最近はオフィスソフトにデータベースもついてきているので、たとえば蔵書の整理にデータベースソフトを使って行うこともできるようになりました。で、個人的にもやっているのですが、改めて思うのは、今のデータベースソフトって最初の設計がすべてで後からの変更は極めて面倒だ、ということです。意味づけについては最初から行って分類をしておいてから検索、集計を行わなければなりません。当たり前だって?確かにその通りです。既に言語化、区分化された中から検索式に沿って探し出すように作られていますのでそれ以上のことを期待はできません。

でも、すごく違和感を感じるのはなぜか。これを考えてみました。

人間が記憶を探るとき、というのはあらかじめ全部言語で一言一句間違いなく覚えている中で検索をしているわけではありません。どちらかというと、言語化される前のイメージの組み合わせから引っ張ってくることが多いと思います。そもそも、言葉(文字列)にする、という事自体が記号化ですしね。そして、イメージを記号化して言葉にするわけですが、このやり方には何種類のアプローチがあると思うのです。

たとえば、スペースシャトルに関しての「記憶」として考えた場合、たとえば打ち上げ台にあるイメージがあり、ここから「大きさ」、「色」、「補助エンジン」、「外部タンク」、「翼がある」・・などの記号化を行います。フィールド数は後付ですね。ですので、引っ張り出されるイメージから出てくる言葉を検索キーとして考えた場合、そのとき初めて出てくるような言葉だと記号化済みデータ検索データベースでは探すことが困難、となってしまいます。

これをたとえば画像記録と、画像の事後解析が可能になれば人間がコマンドを出すことに対して違和感のない検索結果が出てくるようにも思えます。文章に対しても同じですね。「泣ける小説」を探す、にしても今は「この小説は泣ける!」などの書評があれば引っかかりますが、全文記録があっても誰も読んだことが泣く、文中にこの言葉が無いと文字列検索でも使えないことになります(言語解析、ですね)。

グーグルのえらいひとは既にこんなことは気づいて実施しようとしていると思いますが、このような事後解析型、意味を人間と共有できるシステム、が出来てやっと違和感の無い検索が可能になるのかな、とも思っています。


2005 07 29 [パソコン・インターネット] | 固定リンク

トラックバック

この記事のトラックバックURL:

この記事へのトラックバック一覧です: 言語解析とデータベース:

コメント

Wikiを使って蔵書管理なんて、いかがでしょう?

投稿者: ひろ (Jul 29, 2005, 8:19:09 PM)

ひろ様

Wiki、お手軽に使えるデータベースとしては面白いと思っています。自分用としてはOKですね。(既に読んでいるので引っかかりがあればよい)

投稿者: skywolf (Jul 30, 2005, 4:24:16 AM)