面向内容的信息检索模型研究

吴晨


目 录

目 录 I
摘 要 III
ABSTRACT V
第一章 引言 1
1.1 问题的提出 1
1.2 信息检索技术研究现状 2
1.3 本文研究的主要内容 6
1.4 文本研究的贡献 7
1.5 本文内容的组织 8
第二章 HNC相关知识介绍 10
2.1 HNC理论概述 10
2.2 HNC的语义表示方法 11
2.2.1 概念基元符号体系 12
2.2.2 句子语义表示体系 13
2.2.3 句群语义表示体系 15
2.3 HNC中的自然语言理解模型 16
2.3.1 句子理解 17
2.3.2 句群理解 20
2.4 本章小结 22
第三章 语义与统计方法的结合 23
3.1 寻找结合点 23
3.1.1 基于词汇概念知识的检索模型构建思路 24
3.1.2 基于句群语义的检索模型构建思路 25
3.2 检索模型的探讨 26
3.2.1统计语言模型的深入 26
3.2.2 提升语言模型的两点思考 28
3.3 语义和统计的互补 29
3.4 本章小节 30
第四章 面向内容的信息检索模型的工程化问题 31
4.1 模型的体系结构设计 31
4.2 索引文件设计 33
4.3 系统主要处理逻辑 41
4.3.1 倒排索引构建逻辑 41
4.3.2 聚类构建逻辑 43
4.3.3 搜索逻辑 43
4.3.4 概念表达(词语)的快速匹配策略 46
4.4 本章小结 48
第五章 基于词汇概念知识的信息检索模型 49
5.1 模型描述 49
5.2 聚类方法 51
5.2.1 文档距离计算 52
5.2.2 聚类生成算法 52
5.3 查询分析 53
5.3.1 自动转换 54
5.3.2 交互方式 55
5.4 相似度计算 55
5.5 相关实验分析 59
5.5.1 实验测试集 59
5.5.2 对比测试设计 62
5.5.3 测试方法 67
5.5.4 实验结果 67
5.6 本章小节 84
第六章 基于句群语义的信息检索模型初探 85
6.1 模型描述 85
6.2 句群的切分 87
6.2.1 从语义的角度 88
6.2.2 从形式上看 92
6.2.3 句群划分相关实验及分析 93
6.3句群语义提取 94
6.4 查询分析 96
6.5 采用语境单元表示法的相似度计算 97
6.6 相关示例分析 99
6.7 本章小结 104
第七章 结束语 105
7.1 本文研究工作及贡献 105
7.2 本文研究工作的不足 106
7.3 基于篇章语义的信息检索模型思考—暨下一步工作展望 107
附录A:HNC语言空间语句标注符号 110
附录B:新版语句格式代码设计说明 112
参考文献 117
攻读博士期间发表的论文和参加科研工作情况 125
攻读博士期间发表的论文 125
参加科研工作情况 126
已申请的发明专利或者计算机软件著作权登记 126
致 谢 127