12 月 29 日消息,Hugging Face、英伟达和约翰霍普金斯大学研究人员联手为 Hugging Face 上的热门编码器模型 BERT 推出了全新版本 Mode … Continue reading ModernBERT 模型公布,接任“Hugging Face 下载榜第二”2018 年经典原版
标签: BERT
bert之tokenizer 详解
tokenizer基本含义 tokenizer就是分词器; 只不过在bert里和我们理解的中文分词不太一样,主要不是分词方法的问题,bert里基本都是最大匹配方法。 最大的不同在于“词”的理解和定义。 … Continue reading bert之tokenizer 详解
谷歌提出多语言BERT模型:可为109种语言生成与语言无关的跨语言句子嵌入
新智元报道 来源:Google 编辑:雅新 谷歌研究人员提出了一种 LaBSE 的多语言 BERT 嵌入模型。该模型可为 109 种语言生成与语言无关的跨语 … Continue reading 谷歌提出多语言BERT模型:可为109种语言生成与语言无关的跨语言句子嵌入