基于概念知识关联的中文人名和机构名称识别

贾宁


目录


摘要 I
ABSTRACT III
目录 I
第一章 引论 1
1.1问题提出 1
1.2相关研究进展 2
1.3本文的主要研究内容 4
1.4本文的贡献 5
1.5本文的内容安排 6
第二章 研究基础 8
2.1概念基元空间 8
2.1.1概念空间的表示 8
2.1.2 pp类概念 9
2.2句类空间 9
2.3领域句类知识概述 12
2.3.1.1HNC理论中的领域 12
2.3.2领域句类表示式 13
2.3.3概念关联知识 14
2.4整体思路 15
2.5本章小结 16
第三章 语义块关联知识 17
3.1概述 17
3.2概念层面和词汇层面的语义块关联知识 17
3.2.1概念层面的语义块关联知识 17
3.2.1.1概念层面的语义块关联规则 18
3.2.1.2规则的应用处理 28
3.2.2词汇层面的语义块关联知识 31
3.3领域空间的语义块预期知识 34
3.3.1领域句类表示式与句类表示式的对应 35
3.3.2 领域句类的语义块与句类空间语义块的对应 37
3.3.3领域知识的语义块预期规则 41
3.4实验及分析 43
3.5本章小结 44
第四章 语义块构成分析 46
4.1问题提出 46
4.2语义块内组合结构的分析 46
4.2.1简单构成 46
4.2.2并列结构 47
4.2.3简单偏正结构 49
4.2.4并列和偏正的混合歧义 51
4.3语义块的复合构成与BC分解 52
4.3.1语义块的复合构成 52
4.3.2语义块BC分解规则 53
4.3.2语义块BC分解规则的应用 63
4.3.2.1语义块BC分解的关键问题 63
4.3.2.2语义块BC分解流程 64
4.4概念区分度递减通则 65
4.4.1概念区分度递减通则的定义 65
4.4.2区分度递减通则的应用 66
4.5人名与机构名称的构成特点 67
4.5.1人名的构成特点 67
4.5.2机构名称的构成特点 68
4.6实验及分析 70
4.6.1语义块BC分解的测试 70
4.6.2语义块组合结构部分的测试 71
4.6.3联合测试 72
4.6.4人名及机构名识别测试 73
4.7本章小结 75
第五章PP类概念省略的恢复 76
5.1引言 76
5.2省略与HNC 76
5.3省略的判定及恢复 78
5.3.1省略的判定 79
5.3.1.1语义块完全共享 79
5.3.1.2语义块部分共享 79
5.3.2 pp概念省略内容的恢复 80
5.4测试 82
5.5本章小结 83
第六章 软件实现 84
6.1系统详细结构 84
6.2系统软件实现 85
6.2.1基本内容 85
6.2.1.1句类信息的表示 85
6.2.1.2句类代码的分解与分析 86
6.2.1.3 HNC知识库的存储与使用 88
6.2.1.4识别结果表示 89
6.2.2语义块关联规则模块 89
6.2.3语义块BC分解模块 93
6.2.4组合结构分析模块 96
6.2.5命名提取模块 98
6.3本章小结 100
第七章 结束语 101
7.1本文的研究工作及贡献 101
7.2本文的遗憾及不足 101
7.3进一步的研究工作 102
附录A 基于最大熵模型和规则的中文人名识别 103
附录B 基本句类代码和表示式 109
参考文献 112
攻读博士期间完成的论文和参加科研工作情况 116
致 谢 118