面向HNC的语料库软件设计与实现

目 录


摘要 I
ABSTRACT II
目 录 i
第一章 引言 1
1.1 问题的提出 1
1.2 HNC背景知识介绍 1
1.3 HNC语料库的内容与意义 2
1.4 本文的工作及内容安排 4
第二章 HNC语料库系统设计 6
2.1 HNC语料库概述 6
2.2 HNC语料库系统设计方法 7
2.2.1 三层架构 7
2.2.2 接口层 8
2.2.3 实现层 11
2.2.4 应用层 11
2.3 语料库的存储结构 12
第三章 多用户语料库管理平台 13
3.1 平台的由来 13
3.2 语料库集合的组织结构 13
3.3 平台的实现 14
3.4 平台的语料库存储结构 15
3.5 平台的管理 16
3.5.1 服务器语料库架构 16
3.5.2 用户权限 16
3.5.3 系统管理员 17
3.6 平台与本机语料库的通信 17
第四章 语料库的标注 18
4.1 HNC标注总体介绍 18
4.2 语句级HNC标注 18
4.2.1 标注的内容 18
4.2.2 标注信息的XML描述 19
4.2.3 基于XML的标注工具 20
4.2.4 另一种标注方案 22
4.3 语境单元标注 23
4.3.1 句群与语境单元 23
4.3.2 语境单元标注 23
4.3.3 语境单元标注工具 24
4.3.4句群标注信息的存储 25
第五章 机器辅助标注研究 27
5.1 机器辅助标注介绍 27
5.2 基于最大熵模型的语义块切分 27
5.2.1 语义块切分的任务 27
5.2.2 语义块切分模型总体设计 28
5.2.3 最大熵模型的构建 30
5.2.4 测试及结果 32
5.3 基于实例的句类判断模型 33
第六章 语料库的检索与统计 35
6.1检索统计概述 35
6.2 语料库的全文检索 35
6.2.1 全文索引 35
6.2.2 基于C/S架构的全文检索系统 36
6.2.3 服务器端 37
6.2.4 客户端 38
6.3 语料库的HNC特征检索 39
6.3.1 XML查询语言介绍 39
6.3.2 熟语料库的HNC特征检索模型 40
6.3.3 基本检索 40
6.3.4 高级检索 41
6.3.5 XQuery检索 42
6.3.6 检索结果的树形结构图 43
6.4 语料库的常规统计 44
6.5 语料库的HNC特征统计 44
6.5.1 HNC特征统计的分类 44
6.5.2 HNC特征统计的实现 46
6.5.3 图表式的HNC特征统计 47
第七章 相关工作 48
7.1 HNC句类重组语料库 48
7.1.1 句类重组语料库的意义 48
7.1.2 句类重组语料库系统功能 48
7.1.3 句类重组语料库的存储 49
7.2 HNC标注语料的XML转换工具 50
7.3 HNC基础模块 51
7.3.1 格式代码解析 51
7.3.2 句类代码解析 52
7.3.3 句类格式组合解析 52
7.4 人名及指代标注工具 53
第八章 结束语 54
8.1 论文工作总结 54
8.2 今后的工作 54
参考文献 56
附录A:HNC语料标注符号说明 58
攻读硕士期间发表的论文和参加的科研项目 59
致谢 60