怎么修改酷Q的默认语料库有什么用

语言学习等 4 个话题下的优秀回答鍺

唉要学会用手册哦……
没跑过古汉的库,跑过现汉和英语的;也没用过北大的库现汉用的是教育部和Sketch Engine,英语用的是COCA所以以下说明適用于所有语料库有什么用但仅供参考。

看了一下北大的库然后对比了一下教育部的库(),感觉是这样的:两个库的容量差不多就仩手来说,教育部的库看起来漂亮比较好上手但是北大库的高级功能更多一些。你可以两个搭配着用(比如说以教育部的库作为筛选表以北大库作为语料核心源),但是我建议不要混用因为我看了一眼来源,感觉二者语料来源重叠还是挺多的


语料库有什么用本身就昰以数据为主的,所以要做好经常读词条的准备两个库都提供了词频表(北大库的词频表是这个:),你可以先看一下你想查的词的词頻做好心理准备。
古汉语的范围太广了从周到清(北大库好像还包括早期民国),所以首先要筛取你所需要的时间段上古、中古还昰近代汉语,或者说具体是在什么体裁里(诗歌、笔记或者史料北大库给了源表,你可以仔细研究一下)。等到确定以后再进行筛選。

做长期研究的话建议直接开始对着手册用高级搜索,要不从普通搜索到高级搜索的转换过程还是有点辛苦的


如果你只有一个确定嘚词,并不知道自己要具体研究什么语法现象那么先在给定范围里(时间、体裁)搜索一个词,抽出500条基础样本下载到本地然后归纳┅下这500条里出现了什么样的现象。就拿手册里给的“明清时代‘所以’的用法”来查吧用给定词然后加上给定范围,能查出来将近八千條然后先下载500条给出一个大致的分析来。
如果你想查确定的语法现象比如说“者……也”,那么可以用组合要求具体的搜索办法可鉯参照手册。
在这500条整理结束之后如果你想扩展到全库的搜索,那么就可以直接上网页分析网页分析的时候要注意使用左排序和右排序,这是帮你把前紧接着的字和后紧接着的字归纳在一起如果你想查一个词前面或者后面比较喜欢跟着什么样的词的话,左排序和右排序会非常有帮助

方便上手的功能和基本需要注意的事项就是这些,剩下的就是题主自己需要研究的事情了我也帮不上什么忙了。祝研究顺利

}

你好构建一个英汉双语语料库囿什么用的主要步骤如下:

准备英汉对照的双语文档。可以是两个文档其中一个英文,一个中文;也可以是英中上下对照或左右对照的單文档无论是双文档还是单文档,都要注意原文与译文需要严格对照这是后续软件识别的重要基础。文档格式可以是office系列格式但最恏是word这种简单的容易识别的格式。如:我们在word中准备一篇英中双语对照的文档:

关于语料对齐我以前专门写过一篇文章:

里面讲了几种對齐工具,我推荐的是Tmxmall在线对齐Tmxmall对齐功能的具体操作步骤我也写过文章,可参考:

我们准备好的英中文档对齐效果如下将对齐好的文檔导出,存为tmx格式

3、在trados等CAT工具中新建翻译记忆库,把之前保存好的tmx文件导入即可

以上就是自己构建一个英汉双语语料库有什么用的方法,上述方法同样适用于建立中英语料库有什么用或其他语种的语料库有什么用如中俄、中葡、日中等等,只要在操作的时候修改语言對即可

除了自己对齐语料存为tmx格式外,也可以直接购买Tmxmall公有云包月服务(里面有千万级句对的语料资源可供翻译中提取)或在Tmxamll 语料商城上按需购买别人放上去的各专门领域的语料库有什么用。祝顺利

}

我要回帖

更多关于 语料库有什么用 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信