语料库结构


介绍


语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。
语料库资源的重要形式不言而喻的,而现在人们创建语料库的方法就是大不相同。实验室,公司,或个人使用不同的方法创建不同格式的语料库,这些语料库大多数只适用于个别系统或是软件,无法直接应用到其他系统或软件上。我们希望通过我们的平台SECTra操作这些语料库,从而可以使这些语料资源更适合我们的学习和研究。

语料库结构分析