EricJJ' Blog

写代码

Tag : NLP

中文词语粗分

闲来无事 看了 基于N-最短路径方法的中文词语粗分模型 一论文, 这个分词模型也存在缺点, 难以消除歧义, 所以只能叫粗分; 打算尝试下隐马尔科夫模型, 用于分词系统: Read more

TextRank 提取摘要

接上篇所述, 我们实现了提取一段句子的关键字, 接下来实现提取摘要, 我们可以接着根据 PageRank 算法, 按照我们划分出来的关键字生成权重, 语料: Read more