2009年度 名古屋大学 国際開発研究科 公開講座

コーパスを利用した言語研究のためのテキスト処理入門

− 終了しました −

■1. 講座概要

開講の主旨・
講座内容:

最近,言語研究や言語教育にコーパスを利用するケースが増えていますが,コーパスから目的に合わせ適切にデータを抽出するには,処理対象となるコーパスの中身と処理過程の理解が不可欠です。専用ツールには簡単に使えすぐに結果が得られるものも多く便利ですが,利用者には見えないところで処理が行われるため,意図通りの処理がなされているのか考えずに使用してしまう危険性もあります。

このような背景を踏まえ,この講座では,テキストエディタ,正規表現,表計算ソフト,UNIXのテキスト処理ツールなどの汎用的なツール・技術を使ってデータを処理しながら,基礎的なテキスト処理技術を身に付けるとともに,情報抽出・加工の過程を段階ごとに確認しながら処理を進めることで,適切にデータ処理を行うセンスを養うことを目指します。

講座は,コンピュータ室での実習を中心に,講義も交え,4日間にわたり集中的に行います。

受講対象者:

本講座の主な対象は,言語研究・言語教育にコーパスを利用しようと考えている大学生,大学院生,研究者,教師です。日頃,コンピュータを使っている方を想定していますが,コンピュータに関する専門的な知識・技術は前提とはしません。

対象言語: 具体的な処理の例として使用するのは英語と日本語のテキストになりますが,どの言語のテキストを処理するうえでも基礎となる内容が中心となります。
担当講師: 大名力 (国際コミュニケーション専攻 言語情報システム講座 准教授)
阪上辰也国際開発研究科 特任助教)
定員:18名
受講料:9,200円
開催期間: 2009年7月31日 (金) 〜 8月3日 (月)
(全24時間。日にちにより時間が異なります。)
会場: 名古屋大学 国際開発研究科棟 (愛知県名古屋市千種区不老町)

■2. お申し込み方法・お問い合わせ先

募集期間: 6月29日 (月) 〜7月3日 (金)
(先着順。空き数よりも多くの申し込みがあった時点で,同着分の中から空き数分抽選。)
申し込み方法: 募集要項にある「受講申込書」,「受講票・領収証書・領収証書(控)」に必要事項を記入の上,受講料及び返信用封筒を添え書留郵便でお申し込みください。詳しくは,募集要項をご覧ください。
要項の入手方法: 本サイトからPDF版をダウンロードし,ご使用ください。
申し込み先: 名古屋大学 大学院 国際開発研究科 事務室
 住所: 〒464-8601 名古屋市千種区不老町B4-5 (700)
 電話: 052-789-4952・4953 [9:00 a.m.〜5:00 p.m.]
 FAX: 052-789-4951
内容に関する:
問い合わせ先 
corpus2009@gsid.nagoya-u.ac.jp (担当: 大名 力)

■3. 日程および主な講義内容

時間 主な内容
1日目
7/31 (金)
5時間
12:00-17:00
  1. サーチエンジンによる用例検索[大名]
  2. コンピュータの基礎知識[大名]
  3. 表計算ソフトによるテキスト処理1[大名]
2日目
8/1 (土)
7時間
9:00-17:00
(昼休み1時間)
  1. 表計算ソフトによるテキスト処理2[大名]
  2. 正規表現によるテキスト検索[大名]
  3. 文字コード
3日目
8/2 (日)
7時間
9:00-17:00
(昼休み1時間)
  1. テキストエディタによるテキストの検索・加工[大名]
  2. UNIX入門[大名]
  3. UNIXのテキスト処理ツールの利用[大名]
4日目
8/3 (月)
5時間
9:00-15:00
(昼休み1時間)
  1. コーパスデータの統計処理 (R入門)[阪上]
  2. コーパスの構造,コーパス利用の注意[大名]
  3. まとめ,質疑応答[大名・阪上]
上記の時間帯には休憩の時間も含まれます。初日には昼休みの時間はありません。

2009/06/07 作成
2012/08/23 最終修正