93 语料库语言学 2016年 第3卷 第1期 大数据背景下 BCC 语料库的 研制 北京语言大学 荀恩东 饶高琦 热心的黑米 臧娇娇 提要: “北京语言大学语料库中心 BLCU Corpus Cen … Continue reading BCc语料库,bcc语料库使用手册
标签: 语料库
Meta 发布首个「非参数化」掩码语言模型 NPM :吊打 500 倍参数量的 GPT-3
Meta 发布首个非参数化掩码语言模型 NPM:那年双手插兜,不知道什么叫做 out of vocabulary 虽然大型语言模型在 NLP 领域展现出的强大性能十分惊人,但其带来的负面代 … Continue reading Meta 发布首个「非参数化」掩码语言模型 NPM :吊打 500 倍参数量的 GPT-3
Facebook开源最大规模并行语料,45亿规模
雷锋网AI科技评论按:当前自然语言处理中的大多数方法都是数据驱动的,大多数多语言模型(特别是神经机器翻译系统)都需要并行语料库进行训练。大多数的并行文本都只是适用于几个主要语言(例如英语、汉语),且限 … Continue reading Facebook开源最大规模并行语料,45亿规模