ninjalフォーラム 1

 2月18日のninjalフォーラム(国研ズーム開催)は「語彙資源の構築と活用」がテーマだった。私は私用があったので午前中のいくつかの講演だけ聞いたのだが、そのうちの小木曽智信さんと大西拓一郎さんの講演について書きたい。
 小木曽さんの発表「UniDicを基盤とした語彙資源の連携-コーパスの連携-コーパス・分類語彙表・日本国語大辞典」は国研が開発しコーパス作成に活用している形態素解析用辞書UniDicを分類語彙表や日本国語大辞典と連携させるという発表題目そのままの内容だった。
 非常に刺激的と感じたのは上記の連携を活かして作成中の「ことねり」というアプリケーションだった。これは国研の日本語歴史コーパスを利用するためのアプリである「中納言」が専門家向けであるのに対して、一般向けに作られている。高校生が使うことも想定してタブレットで利用することができるようウェブアプリケーションになっている。
 「ことねり」は試用版が公開されているのでさっそく使ってみた。読みで検索するか、意味で検索するかを選ぶようになっているので読みの検索をすることにしよう。読み(最初の三文字)と品詞を入力するとすべての候補語が画面に出るのでそのうちの一つを選択すると、画面が切り替わって歴史コーパスの対象となっている作品名のリストが表示される。目指す語が入っている作品は青字で表示されるので、クリックするとその語の用例がすべて表示される。
 意味で検索することを選択した場合は、分類語彙表の意味分類が画面に表示されるので、目指す語が属している分類を指定すると候補語が画面に表示される。
 私は国語教育が専門ではないが、好奇心の強い高校生にとって非常に役に立つツールだと思った。たとえば、「ぞ」の係り結びが已然形だと教室で教わったときに実際の用例にあたってそれが常に成り立つかどうかを検証することができる。あるいは、「花」が万葉集の時代に何を指していたかを自分の手で確かめることができる。万葉集でどんな魚が歌に詠まれていたか、詠まれなかった魚にどんなものがあったか簡単に知ることができる。これらは「ことねり」の利用法のほんの一部である。古典文法の学習のみならず、文学として歴史的な文献を鑑賞するうえでも非常に役に立ちそうだ。そういう意味では高校生大学生にとどまらず一般人も大いに利用すべきものだと思う。
 今は日本語歴史コーパスのみが検索対象になっているが、現代語のコーパスも対象に加えてほしい。文章を書いているときに語の使い方に自信がなくなるときがあるが、用例を手軽に調べることができれば大きな手がかりが得られることになる。ChatGPTよりも文章を書くのに助けになるのではないか。
 と、私の妄想も交えつつ大いに持ち上げたのだが、試用版をいじってみて大きな問題があることに気がついた。
 用例を表示させようとすると動作が非常に重くなるのだ。いつまで経っても用例の画面に切り替わらない。試用版でこれだから、全国の高校生がいっせいにアクセスしたら全然使い物にならないだろう。
 これは「ことねり」の問題ではなく、「ことねり」を置いてあるサーバーの能力が低すぎるためだろう。「ことねり」を本当に一般向けのものとして公開するためには強力なサーバーを用意しなければならない。そのためには資金がいる。それは国研の手に余ることではないかと思われる。国民全体の教養と日本語能力の向上にどうしても必要と社会に説明をして予算を獲得する必要があるかもしれない。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です