方言研究の補助としてのAI

 最初に断っておきたいのだが、私は何でもコンピューターにやらせることが正しいとは思っていない。コンピューターで仕事をするのは二つの場合しかない。コンピューターを使ったほうが人手よりもずっと速かったり大量にできてしかも正確な場合とコンピューターでしかできない仕事をする場合だ。
 単純な作業でコンピューターを使ったら人手よりもずっと正確に簡単に仕上げることができることが分かっているときにわざわざ人手でやろうとする人がいる。そういう実例を見ると私に非常に複雑な感情がわき上がってくる。それは明らかに間違った行いだと思う。
 AIがこれだけ実用化してきたら我々の研究の補助として使えるのではないだろうか、ではどんな使い道があるだろうと考えるのが最近の習慣になっている。手近に便利に使えるものがあればそれを使わない法はない。ただし、もうひとつ断っておきたいのだが、私はAIをまるっきり信用しているわけではない。だから、AIの出してきたものを人間がチェックすることは必要だと思っている。
 印刷した言語地図から情報を読み取って、何らかの加工をすることがある。このときに言語地図を「データ化」すると言うが、それは全体の図を絵と同じようにデータ化する場合が多い。地点ごとのデータ(記号で示されている語形と位置情報)を読み取ってデータ化するのはあまり普通ではない。それはできないことはないが、手間がかかる。
 でも、後者のやり方でデータ化できればその方がいい。そうやって作ったデータを地図に還元することもできるし、地図以外にも使えるからである。そこで考えたのだが、

AIにやらせてはどうだろうか。

 手順としてはまずAIを訓練して●や▲などを認識できるようにする。次に●が地図上にあるときに、地図のどの位置にあるのか報告できるようにする。これくらいだろうか。だろうかというのは、AIを使って何か新しいことをやらせるという経験がないからである。
 ここまで書いてきて、もしかすると上の作業はビットマップデータのファイルの書式が分かれば、AIを使うまでもなくできることかもしれないと思えてきた。誰か書式を教えてくれないだろうか。
 AIでできそうなことはほかにもある。たとえば、国研の方言コーパスで音声分析をして得られたイントネーションの情報を聞き取りの文字データに紐付けすることをしようとしているようだが、これには膨大な人手が要る。国研ではそれをボランティアの研究者の力で成し遂げようとしているらしいのだが、こんな直接には研究者の業績にならないし、本人の研究の役にも立たないような作業はAIに任せるべきではないのか。AIですべてを行うのでなく、AIが作業の前処理をして人間が仕上げを行うようにした場合でも人手は大幅に減らせる。国研の意図が私の推測通りなのか、またそれがAIでできることなのか分からないが、若い研究者の貴重な研究時間を奪うべきではない。
 私の理解とそこからの推論によれば、国研の計画は恐ろしいほどのマンパワーを必要とする。とても計画の年限(そもそも何年計画なのかも知らないが)で完成させることができないだろう。全体の何十分の一かのデータで試行をして作業量の見積もりをしたのだろうか。今になって作業量の膨大さに恐れをなしているのでなければいいが。
 私の想像通りだったら、なおさらAIを使った省力化を検討すべきだと思う。そんな無謀な研究計画は最初から実行しないほうがいいという意見は脇に置くことにしても。
 AIによる研究の省力化自体は言語学あるいは方言学プロパーの業績にはならないが、その方法が方言研究者一般を益するものであればそれを開発して広めるのは国語研究所の使命ではないだろうか。
 実は日本語研究でAIは既に使われている。国研で公開している日本語解析ソフトのUnidicではAIを使っているらしい。私もできることならAIを使えるようになりたいとは思うのだが、ほかに覚えなければならないことがあるのでそこまで手が回らない。AIを使った言語研究の省力化こそAIの専門家とことばの専門家が手を結んでするべきなのだろうと思う。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です