群馬の談話資料のKWIC 2

あのKWICをどうやって作ったかを全くのブラックボックスにしておくのはまずいので原材料のテキストファイルとプログラムをまとめてダウンロードできるようにした。 ダウンロードはここから ダウンロードしたファイルを解凍するとk… 続きを読む 群馬の談話資料のKWIC 2

『方言談話資料』からKWICを作る

国研が出した『方言談話資料』の一部をKWIC化する作業を始めている。これはこのサイトの目的の一つだった「KWIC作成で学ぶプログラミング講座」の材料となるものだが、プログラミング以前にデータを整備する作業に手間取っている… 続きを読む 『方言談話資料』からKWICを作る

『徳之島方言二千文辞典改訂版』付属DVD

 2009年発行の科研費報告書につけたDVDの中身である。当時200人以上の方にお送りしたと記憶しているが、研究者として新しい方はお持ちでないことが多いと思う。 岡村・沢木・中島・福嶋の制作によるマルチメディアDVDであ… 続きを読む 『徳之島方言二千文辞典改訂版』付属DVD

本ブログの構成

方言コーパスに関するトピックが本HPの主なコンテンツですが、ほかにも私(沢木幹栄)の関心にしたがっていくつかのカテゴリーを設けました。 Jポップ、KWIC、コンピューター、データの説明、プログラムとその解説、奄美・徳之島… 続きを読む 本ブログの構成

KWIC、コーパスにコンピューターが不可欠な理由

 KWICとコーパスはコンピューターなくしては作り得ない。日本で言語研究にコンピューターの導入したのは国研が最初だったが、テキストデータがあればKWICを作るのが国研ではお決まりだった。デジタル化したテキストとコンピュー… 続きを読む KWIC、コーパスにコンピューターが不可欠な理由

KWIC

 コーパスを作るためにはまずKWICを作らなければならない。徳之島方言の研究ではKWICからコーパスを作ったが、最初からそれを狙ったわけではない。予期しない形で『日本語二千文』の徳之島方言版ができて、それも最初から電子的… 続きを読む KWIC