作 者 :马燕Organ-单位: 河北农业大学
期 刊 :河北农业大学 2014年 03期 页码:59
关键词:自然语言处理;农业命名实体;条件随机场(CRF);特征选取;
摘 要 :命名实体是文本中最基本的信息元素,是正确理解文本的基础。命名实体识别是要判断一个字符串是否代表一个命名实体,并且它的类别,即发现命名实体和标注命名实体的类别。命名实体识别广泛应用于自然语言处理任务中,如机器翻译、分本分类、信息检索和自动文摘等,所以命名实体的研究成果必将推动自然语言处理领域的相关研究。本文对农业中的命名实体进行识别研究,从以下几个方面进行了研究和探讨。 第一,总结了前人研究命名实体识别的方法和研究现状,深入了解了近年来国内外命名实体识别的评测活动,总结了农业命名实体识别研究的困难;深入学习隐马尔科夫(HMM)模型、最大熵(ME)模型、条件随机场(CRF)模型理论知识、模型...