2006年03月04日

書き言葉コーパス

国立国語研究所は、書かれた現代日本語のデータベース書き言葉コーパス構築に乗り出す。      
2010年までの5年計画で、世界最高水準といわれるイギリス英語を集めたブリティッシュ・ナショナル・コーパス(BNC)の1億語を上回る規模を目指す。
日本語の語彙研究や辞書編集、常用漢字表の見直し、コンピューターによる言語処理など幅広い応用が期待される。
コーパス(corpus)原義は身体、(文献などの)全集。
実際に書かれたり、話されたりした文章を言語活動の実態に沿ってバランスよく集め、分類した大量の資料。
‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥ ‥‥
 朝日新聞 2006年3月1日    こちらもどうぞ⇒ネット社会、その光と闇を追うー
posted by asaborake at 23:24| 東京 ☀| Comment(0) | TrackBack(0) | 文化 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:


この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。