本文主要针对其中最常用的一套《北大规范》为依据,来讲解中文词汇自动切分的几个重点流程。enjoy~
“中华人民共和国”根据二元词典的匹配结果是 中@华 15 华@人 14 华@民 13 民@国 12 民@人 人@民 19 民@国,将这些词拼成完整句子的权重最小的一个。输出句子结果。