「方言コーパス」のカテゴリーの記事で取り上げる研究が主に材料とするのは「徳之島二千文」である。いろいろな論文で「徳之島二千文」が言及されており、このサイトでも話題の中心になると思われるが、この名前の書籍があるのではない。
これは『日本語二千文』(アンリ・フレ著1971年早稲田大学語学研究所発行)のなかにある二千文(以後、書籍を『日本語二千文』、そのなかにある二千の文を「日本語二千文」と呼ぶことにする)を徳之島生まれ、現在同地に在住の岡村隆博氏(普段は「岡村先生」とお呼びしている)がご自分のnativeの方言である天城町浅間集落の方言に「した」ものである。翻訳ではなく、内容を自分のものにしたうえでそれを浅間方言として自然な形に表現し直したのである。
このことは『日本語二千文』の序言で小林英夫が「翻訳ではなくadaptation」と書いていることと軌を一にするものである。だから、188「何だか羊くさいね」が「何だか山羊臭いね」と変換されているように、徳之島にもともとないものはそれに近いもので代用したりしている。
最初の稿ができたのがいつだったか記憶がはっきりしないのだが、おそらくは1999年ごろではなかったかと思われる。そのまえに沢木が岡村氏をインフォーマントとして調査を行った際に「日本語二千文」を使ったところ岡村氏がこれに興味を示したので、コピーをお送りした。すると、一月もたたないうちに今度は岡村氏からワープロ専用機(若い人は知らないかもしれないがそういうものがあって普及していた)のフロッピーが送られてきたのでそれを沢木がMSDOSのファイルに変換した。ワープロ専用機の入力に熟達していた岡村氏ならではの迅速な執筆だった。このような経過だったので、第一稿は岡村氏ひとりの作品ということになる。こういう形で方言のテキスト(文字化資料)ができるのはとても珍しい。岡村氏は「徳之島方言の音韻」(1960、国語学41、柴田武)のインフォーマントであり、この論文も氏の卒業論文作成の過程で行われた調査がもとになっている。ご自身の方言の内省のための音声学も音韻解釈もそのときから氏の血肉になっていたのである。したがって「徳之島二千文」も音素表記で書かれている。ある意味では理想的なインフォーマントとも言える。
「徳之島二千文」の成立と前後して一橋大の中島由美さん、県立新潟女子短期大学(のちに新潟県立大学)の福嶋秩子さんとの共同研究が始まった。その経緯については科研費報告書『徳之島方言二千文辞典』(2006)に詳しい。なお、科研費による研究活動および関連する業績については次稿「「徳之島二千文」からKWICを作る」に譲る。
この報告書の刊行に際して、中島岡村の両氏によって「徳之島二千文」のテキストの確定が行われた。第一稿では「日本語二千文」から発想してかなり自由に徳之島文が作られていたが、確定後は「日本語二千文」と「徳之島二千文」が一対一で対応するなど、「おとなしく」なっている。
次の科研費報告書では書籍形態の報告書にDVDをつけることにした。「徳之島二千文」から四通りのKWICを作ったが、それをそのまま出版した場合、巨大な本になる(3600ページか)ことが分かっていた。KWICを見せることのできない報告書は意味がない。DVDにする以外なかったのである。
この報告書作成の時点で私はコーパス作成に移ることを考えていた。最後の科研費報告書ではコーパス化の成果が一部使われている。ただし、コーパスと言っても未完成なもので、形態素に切り分けて品詞の情報をつけただけだった。切り分け方が正しいかどうかチェックできていなかったし、同語異語判別もできていなかった。動詞の扱い方も未決定だった。完成させるための突破口が見つからない時期だったと思う。
岡村氏の経歴
岡村隆博(おかむら たかひろ)元鹿児島県伊仙町立伊仙中学校校長
1936年鹿児島県大島郡天城町浅間に生まれる。1959年日本大学文学部国文学科通信教育課程卒業。同年より38年間にわたり鹿児島県中学教諭として、奄美大島、肝属郡、揖宿郡、徳之島各地の中学校に勤務、日大在学時に柴田武講師(当時国立国語研究所地方言語研究室長)より卒業論文の指導を受けて方言研究に目覚め、母方言や奄美諸方言の研究に取り組む。1955年退職後も方言研究を継続、天城町文化協会長などを務め、徳之島の言語文化について執筆活動を行っている。2021年、「永年にわたり徳之島方言を中心に消滅の危機にある奄美方言の記録・普及・啓発に尽力し成果を上げるなど我が国の国語施策の進展に多大な貢献をしている」として文化庁長官表彰を受彰した。
(『徳之島方言二千文辞典改訂版』など)