- 作者刘知远 weibo:http://weibo.com/zibuyu9 主页:http://nlp.csai.tsinghua.edu.cn/~lzy
- 翟成祥老师早期在语言模型的工作很有影响力,他在2009年写过一本综述专著:Statistical Language Models for Information Retrieval,建议阅读。
- 北大 @BatmanFly (现在是人大老师啦)他们做的Knowledge Sharing via Social Login: Exploiting Microblogging Service for Warming up Social Question Answering Websites在微博和知乎之间建立了语义联系,也是很赞的角度。http://t.cn/RPOzhh4
- COLING 2014论文集:http://t.cn/RPpdIIk ,首先要去看今年最佳论文,中科院自动化所 @刘康_自动化所 赵军老师团队的大作:Relation Classification via Convolutional Deep Neural Network。:)
- 斯坦福Richard Socher在EMNLP2014发表新作:GloVe: Global Vectors for Word Representation 粗看是融合LSA等算法的想法,利用global word co-occurrence信息提升word vector学习效果,很有意思,在word analogy task上准确率比word2vec提升了11%。 http://t.cn/RPohHyc
- 哈工大@张牧宇-哈工大SCIR 的Triple based Background Knowledge Ranking for Document Enrichment利用knowledge triple表示文档,与今年WSDM的Knowledge-based Graph Document Modeling有异曲同工之妙。
- 发现哈工大的这篇 Learning Sense-specific Word Embeddings By Exploiting Bilingual Resources 利用双语数据学习词义表示。多语角度很有意思。
- MSRA A Probabilistic Model for Learning Multi-Prototype Word Embeddings,基于skip-gram采用概率模型和EM算法解决一词多义的表示问题。
- @周光有_CAS 和赵军老师在社区问答系统上的工作:Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives。最近word embedding和NMF都开始在NLP领域大显身手了。
- IBM有篇Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts,在Fine-Grained的评测上效果比Socher的RNTN高大约3个百分点不到。
- MSRA有篇 A Probabilistic Model for Learning Multi-Prototype Word Embeddings,基于skip-gram采用概率模型和EM算法解决一词多义的表示问题。这个问题很有实用价值。@陈新雄_THU 也将在今年EMNLP展示我们组在这方面的工作:A Unified Model for Word Sense Representation and Disambiguation。
- 哈工大和MSRA合作的 Building Large-Scale Twitter-Specific Sentiment Lexicon : A Representation Learning Approach 想法也很有意思,利用word embedding技术构建情感词典。作者 @唐都钰HIT-SCIR 今年还有篇ACL和EMNLP,都是以情感分析为主题,国内NLP新星啊。:)
- 谢 @刘康_自动化所 推介。Jiawei Han老师综述介绍得非常全面,建议以此为入口学习。我们组司宪策师兄博士论文也以此为主题,中文写的比较好读,下载地址http://t.cn/8F1qSPX 。社会标签可从两个角度思考,一是ML角度可看做多标签分类问题,二是NLP角度可看做关键词产生问题,都有大量前人工作参考。
- Richard Socher一如既往很有诚意地放出了代码和数据,大家快围观: http://t.cn/RPohHyc
- David Blei组提出主题模型新概念:Real-time Topic Models for Crisis Counseling。好像是KDD短文。http://t.cn/RPohSwB
- Barabasi团队把“魔爪”伸向了历史学:A network framework of cultural history发表在最近Science杂志的Quantitative Social Science栏目。
- IEEE TKDE上的一篇综述:A Review on Multi-Label Learning Algorithmshttp://t.cn/RPirZh6 @张敏灵-SEU 老师和 @南大周志华 老师的工作,关注。