トップ  »  新着情報  »  2011年11月 月次レポート(水沼修 ポルトガル)

2011年11月 月次レポート(水沼修 ポルトガル)

ITP-EUROPA月次レポート(11月)

水沼 修

 今月は、先月から行っているデータ収集の作業が中心になりました。
 電子化されている中世ポルトガル語のコーパスで代表的なものとしては、リスボン新大学(Universidade Nova de Lisboa)によって作成されている「中世ポルトガル語電子化コーパス(Corpus Informatizado do Portugues Medieval: http://cipm.fcsh.unl.pt/)」が挙げられます。このコーパスには、主に13世紀から15世紀の文学テキスト及び非文学テキスト(一部12世紀及び16世紀のテキストを含む)が数十点収められています。コーパスの形態としては,校訂本がそのまま電子化されており、POSタグ等は付されていません。
 また、ブラジルのカンピナス大学(Universidade Estatal de Campinas)によって作成されている「Tycho Braheコーパス(Corpus Historico do Portugues Tycho Brahe: http://www.tycho.iel.unicamp.br
/~tycho/corpus/index.html
)」には,1380年から1845年の期間に生誕した作家による作品が53点収集されています。これらのうち、32点については、品詞?形態の情報が付されたバージョンも提供されています。
 このほかにも,コインブラ大学(Centro de Estudos de Linguistica Geral e Aplicada da Universidade de Coimbra)によって作成されている「CEC - PPCコーパス(Corpus Electronico do CELGA - Portugues do Periodo Classico: http://www.uc.pt/uid/celga/recursosonline/cecppc
)」があります。こちらには、16世紀から17世紀にかけての文学作品(主にFrancisco Manuel de Meloの作品)が数点収められています。
 また、リスボン大学言語学センター(Centro de Linguistica da Universidade de Lisboa)の「CARDSコーパス(CARDS - Cartas Desconhecidas, Unknown Letters: http://alfclul.clul.ul.pt/cards-fly
/index.php?page=mainpt
)」は、16世紀から19世紀の期間に記された私用の書簡約2000点を電子化したものです。言語学的なタグ付けはなされておりませんが、全ての書簡に、差出人、受取人、日付、場所、内容の要約等の情報が付されています。なお、20世紀の書簡についても、現在電子化作業が行われているところです(FLY - Forgotten Letters Years 1900-1974)。
 現在は、これらのコーパスを利用して、用例の収集にあたっているところです。主な分析対象としては,「haver / ter + 過去分詞」の構文になりますが,博士論文では,これらの動詞(haver / ter)の助動詞としての発展に加え、本動詞としての機能についての考察も行いたいと考えているため、今のところ、haver及びterの全ての生起例を手作業で抽出しています。これらコーパスの用例収集を終えた段階で、指導教員の指導を仰ぎつつ、実際に具体的な用例を見ながら、分析方法の再検討を行うことになっています。その上で、調査対象となる、電子化コーパス以外の資料の選択についても話し合いを行う予定です。
 また、今月は、大学院のセミナー「コーパス言語学」を担当されている先生から、グルベンキアン財団から来年出版される予定の『ポルトガル語文法(Gramatica do Portugues)』の原稿を拝見する機会をいただきました。同書は、リスボン大学言語学センターによる全3巻からなる文法書で、同大学内外の多数の言語学者が執筆者として参加しています。構成は、Bosque, I.,Demonte, V. (dir)の『スペイン語記述文法(Gramatica Descriptiva de la Lengua Espanola)』と似ており、 統語論、形態論、音韻論、意味論、表記法等に関する様々なテーマが取り上げられています。 Mateus et al. の『ポルトガル語文法(Gramatica da Lingua Portuguesa)』と比較しても、扱われているテーマも豊富で、総ページ数も3000を超える予定だそうです。まだ出版前ということで、センター内のみでの閲覧になりましたが、同センターに何度か足を運び、文法化や意味論等、研究テーマに関連する記述を参照することができました。
 今後も、大学院のセミナーへの参加と、先行研究のフォロー及びデータ収集?分析の作業を中心に行っていく予定ですが、日本語投稿論文の執筆準備も同時に進めていきたいと思います。

このページの先頭へ