WebThis site contains downloadable, full-text corpus data from ten large corpora of English -- iWeb, COCA, COHA, NOW, Coronavirus, GloWbE, TV Corpus, Movies Corpus, SOAP Corpus, Wikipedia-- as well as the Corpus del Español and the Corpus do Português.The data is being used at hundreds of universities throughout the world, as well as in a wide … Web知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的解答」为品牌使命。知乎凭借认真、专业、友善的社区氛围、独特的产品机制以及结构化和易获得的优质内容,聚集了中文互联网科技、商业、影视 ...
[bnc] Referring to the BNC - BNC: copyright and restrictions
Web语料库语言学(英語: corpus linguistics )是基于语言运用的实例(即语料库)的语言研究。 语料库语言学可以对自然语言进行语法与句法分析,还可以研究它与其他语言的关系。 语料库最初由手工完成,而现在主要是由电子计算机自动完成。. 语料库语言学家相信,可靠的语言分析需建立在新鲜的 ... WebNov 20, 1995 · This file describes assorted frequency lists and related documentation for the British National Corpus (BNC), to be found on this website. The files are: a bibliographical database; a lemmatised frequency list (various formats) unlemmatised, or 'raw', frequency lists (various formats) variances of word frequencies mother author crossword
CORPORA-北外语料库语言学
http://xisu.ctld.chaoxing.com/pubcontent/info?id=109 http://bncweb.lancs.ac.uk/cgi-binbncXML/BNCquery.pl?theQuery=search&urlTest=yes Web1. 数据下载. 英文语料数据来自英语国家语料库(British National Corpus, 简称BNC)(538MB, 样例数据22MB)和美国国家语料库(318MB),中文语料来自清华大学自然语言处理实验室:一个高效的中文文本分类工具包(1.45GB)和中文维基百科,下载点此(1.96GB),搜狗全网新闻数据集之前下载使用过 mother at work