あのKWICをどうやって作ったかを全くのブラックボックスにしておくのはまずいので原材料のテキストファイルとプログラムをまとめてダウンロードできるようにした。 ダウンロードはここから ダウンロードしたファイルを解凍するとk… 続きを読む 群馬の談話資料のKWIC 2
カテゴリー: KWIC
群馬の談話資料のKWIC
やっとKWICが一つできた。群馬の談話資料を材料にしている。 KWICとはこんなものかと見ていただきたい。 以下はデータのクレジット: 国立国語研究所のデータベース内の『方言談話資料(1)山形・群馬・長野』のテキストファ… 続きを読む 群馬の談話資料のKWIC
『方言談話資料』からKWICを作る
国研が出した『方言談話資料』の一部をKWIC化する作業を始めている。これはこのサイトの目的の一つだった「KWIC作成で学ぶプログラミング講座」の材料となるものだが、プログラミング以前にデータを整備する作業に手間取っている… 続きを読む 『方言談話資料』からKWICを作る
『徳之島方言二千文辞典改訂版』付属DVD
2009年発行の科研費報告書につけたDVDの中身である。当時200人以上の方にお送りしたと記憶しているが、研究者として新しい方はお持ちでないことが多いと思う。 岡村・沢木・中島・福嶋の制作によるマルチメディアDVDであ… 続きを読む 『徳之島方言二千文辞典改訂版』付属DVD
「徳之島二千文」からKWICを作る
「徳之島二千文」の第一稿を見て、沢木はそこからKWICを作ることを思いついた。KWICは沢木が国立国語研究所(国研)に勤務していたときから身近にあった。国研では電子化されたテキストがあれば、それをもとにKWICを作るの… 続きを読む 「徳之島二千文」からKWICを作る
本ブログの構成
方言コーパスに関するトピックが本HPの主なコンテンツですが、ほかにも私(沢木幹栄)の関心にしたがっていくつかのカテゴリーを設けました。 Jポップ、KWIC、コンピューター、データの説明、プログラムとその解説、奄美・徳之島… 続きを読む 本ブログの構成
KWIC、コーパスにコンピューターが不可欠な理由
KWICとコーパスはコンピューターなくしては作り得ない。日本で言語研究にコンピューターの導入したのは国研が最初だったが、テキストデータがあればKWICを作るのが国研ではお決まりだった。デジタル化したテキストとコンピュー… 続きを読む KWIC、コーパスにコンピューターが不可欠な理由
KWICを作る手順
KWICは普通コンピューターのプログラムを動かして作る。プログラムを組み合わせて作業するので、どんな手順になっているかを以下に説明したい。 ウィキペディアにもKWICの説明がある。なかなかわかりやすく書いてあるのだが、… 続きを読む KWICを作る手順
KWIC
コーパスを作るためにはまずKWICを作らなければならない。徳之島方言の研究ではKWICからコーパスを作ったが、最初からそれを狙ったわけではない。予期しない形で『日本語二千文』の徳之島方言版ができて、それも最初から電子的… 続きを読む KWIC