中文分词、词性标注和句法分析是中文自然语言处理的3大基础任务,词性标注作为中间环节,应用十分广泛。但目前的标注体系均是针对自然语言,地名地址作为重要的组成部分,结构复杂,没有明显的分隔符号,随意性大,存在很多问题。所以本文通过分析大量中文地名地址,研究地址成分间的关系,用观测序列决定标注序列,从地址要素角色的角度进行标注。这种方式可以界定词语的左右边界,计算概率,还能确定地址要素中的核心成分,便于成分识别,为地址的相似性度量提供理论基础,提高地名地址匹配率。