A pattern of chinese verbs sense recognition

309 246 0
A pattern of chinese verbs sense recognition

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

汉语多义动词义项辨识模式 A PATTERN OF CHINESE VERB SENSE RECOGNITION 林进展 LIN JIN ZHAN 新加坡国立大学中文系 NATIONAL UNIVERSITY OF SINGAPORE 2011 汉语多义动词义项辨识模式 A PATTERN OF CHINESE VERB SENSE RECOGNITION 林进展 LIN JIN ZHAN 新加坡国立大学中文系 博士学位论文 A THESIS SUBMITTED FOR THE DEGREE OF DOCTOR OF PHILOSOPHY DEPARTMENT OF CHINESE STUDIES NATIONAL UNIVERSITY OF SINGAPORE 2011 Acknowledgments It is the right time to sit down quietly and think about these long yet short, intensive yet joyful years during my PhD study at NUS. There are lots of people and things to which I owe great gratitude in this journey. I’m very grateful to my advisor, Dr. Wang Hui, for her constant care, encouragement and great support during my PhD study. Her extended knowledge and keen appreciation of the frontiers and challenges of the area of linguistics and semantics, her insightful discussions and advice, and her great help with finding reference materials and refining my thesis writings, contributed significantly to the smooth and successful completion of my PhD study. I would like to show my sincere gratitude to my committee members: Dr. Peng Rui and Dr. Gao Hong. Their constructive suggestions guided me to focus on specific, challenging and significant research problems in the last year of my PhD. I would like to thank the group members in our research group of Lexical Semantics and Computing : Xiao Hang, Qin Shao Kang, Wang Yue Long, Bai Xiao Peng, and Xu Ting Ting, for their friendships and the delightful and fruitful collaborations and discussions. Recalling the variety of courses and seminars I attended at NUS, I appreciate all the professors who instructed me in lexical semantics, pragmatics, and cognitive grammar. In addition to the above, I also want to show great gratitude to my family members and friends, who give me warmth, encouragement and happiness. i 目 录 谢 辞 I 统 计 分 析 表 一 览 . VI 图 表 一 览 X 英 文 摘 要 . XI 第一章 绪 论 . 1.1 课题的提出 1.2 研究任务与方法 1.3 全文结构安排 第二章 文 献 综 述 . 2.1 语境与多义词义项辨识 2.2 词义消歧与义项标注 13 2.3 动词的句法语义界面 17 2.4 小结 23 第 三 章 动 词 义 项 辨 识 的 静 态 描 写 . 25 3.1 动词义项辨识的三个层面 25 3.2 基于语法组合特征层面的动词义项辨识 26 3.2.1 程 度副 词 “ 很 ”的 动 词 义 项辨 识 力 26 3.2.2 动 词 后 缀的 动 词 义 项 辨 识 力 28 ii 3.2.3 重 叠式 的 动 词 义项 辨 识 力 36 3.2.4 准 宾语 的 动 词 义项 辨 识 能 力 38 3.2.5 动 补 结 构类 型 的 动 词 义 项 辨 识 力 43 3.2.6 宾 语 语 法功 能 类 型 51 3.3 基于语义特征的动词义项辨识 55 3.3.1 语 义 层 面特 征 的 两 个 维 度 55 3.3.2 基 于 动 词义 类 的 动 词 义 项 辨 识 56 3.3.3 论 元 语 义角 色 的 动 词 义 项 辨 识 59 3.3.4 基 于 论 元角 色 选 择 性 限 制 的 动 词义 项 辨 识 77 3.4 基于固定搭配的动词义项辨识 94 3.5 动词义项辨识特征的辨义率比较 96 3.6 小结 105 第 四 章 动 词 义 项 辨 识 的 动 态 分 析 107 4.1 动词义项辨识的动态层面 107 4.1.1 辨 义特 征 不 充 分 108 4.1.2 辨 义特 征 不 明 确 112 4.2 动态层面动词义项辨识机制 113 4.2.1 语 篇词 汇 衔 接 与动 词 义 项 辨识 113 4.2.2 特 征缺 省 的 动 词义 项 辨 识 123 4.2.3 替 代现 象 的 动 词义 项 辨 识 143 4.3 重复现象中的动词义项唯一性 146 4.3.1 动 词重 复 现 象 与义 项 辨 识 146 4.3.2 句 内 动 词义 项 唯 一 性 157 4.3.3 段 内动 词 义 项 唯一 性 161 4.3.4 篇 内 动 词义 项 唯 一 性 166 iii 4.3.5 重 复 现 象中 义 项 不 一 致 的 动 词 4.4 小结 第五章 172 178 动 词 义 项 辨 识 特 征 动 态 优 先 序 列 . 181 5.1 动词义项辨识特征的动态性及其优先序列研究法 181 5.1.1 动 词 义 项辨 识 特 征 的动 态 性 181 5.1.2 动 词 义 项辨 识 特 征 动 态 优 先 序 列研 究 法 181 5.2 动词辨义特征的出现率 191 5.2.1 语 法 辨 义特 征 出 现 率 191 5.2.2 语 义 辨 义特 征 出 现 率 193 5.2.3 固 定 搭 配特 征 出 现 率 199 5.2.4 各 类 辨 义特 征 出 现 率 统 计 对 比 与综 合 200 5.3 多义动词辨义特征动态优先序列 201 5.3.1 双 义 项 动词 辨 义 特 征 权 重 系 数 202 5.3.2 多 义 项 动词 辨 义 特 征 权 重 系 数 206 5.3.3 动 词 辨 义特 征 平 均 权 重 系 数 210 5.4 小结 212 第 六 章 多 义 动 词 义 项 距 离 与 义 项 分 合 215 6.1 义项辨识与义项分合 215 6.2 动词义项距离计算 216 6.3 动词义项的分合标准 226 6.3.1 义 项 的 合并 226 6.3.2 义 项 的 分立 231 6.4 小结 233 iv 第七章 结 语 . 235 附录一 329 个 多 义 动 词 词 表 . 240 附录二 50 动 词 语 法 组 合 特 征 描 写 241 附录三 50 动 词 论 元 角 色 类 型 特 征 250 附录四 50 动 词 论 元 义 类 选 择 限 制 特 征 257 附录五 50 动 词 义 类 特 征 及 固 定 搭 配 特 征 278 附录六 138 双 义 项 动 词 义 项 距 离 . 284 参 考 文 献 290 v 统计分析表一览 表 1“流动”主体论元角色及义类特征 77 表 2“震动”主体论元角色及义类特征 78 表 3“摆”主体论元角色及义类特征 . 79 表 4“叫”主体论元角色及义类特征 . 79 表 5“裁”客体论元角色及义类特征 . 81 表 6“掩盖”客体论元角色及义类特征 82 表 7“管理”客体论元角色及义类特征 83 表 8“抱”客体论元角色及义类特征 . 84 表 9“害”客体论元角色及义类特征 . 85 表 10“害”邻体论元角色及义类特征 . 86 表 11“投”邻体论元角色 及义类特征 . 87 表 12“锁”凭借论元角色及义类特征 . 88 表 13“套”凭借论元角色及义类特征 . 89 表 14“登 ”环境论元角色及义类特征 . 90 表 15“奔”环境论元角色及义类特征 . 91 表 16“赶”环境论元角色及义类特征 . 92 表 17“读”环境论元角色及义类特征 . 93 表 18“栽 2”固定搭配特征 . 94 表 19“变”固定搭配特征 95 表 20“串”固定搭配特征 95 表 21 双义项动词语法组合特征静态辨义率 . 96 表 22 多义项动词语法组合特征静态个别辨义率 97 表 23 双义项动词论元角色类型特征静态辨义率 98 表 24 多义项动词论元角色类型特征静态辨义率 99 表 25 双义项动词全部语义类特征辨义率 . 100 表 26 多义项动词全部语义类特征辨义率 . 100 表 27 双义项动词三大层面特征辨义率比较 . 102 表 28 多义项动词三大层面特征辨义率比较 . 102 vi 表 29 动词三大层面特征平均辨义率比较 . 102 表 30 双义项动词中各类动词辨义特征辨义率 . 103 表 31 多义项动词中各类动词辨义特征辨义率 . 104 表 32 各类辨义特征平均辨义率比较 105 表 33“了解”语法组合特征对比 . 110 表 34 语篇中动词义项辨识特征分析抽样动词表 114 表 35“欢迎”论元角色类型特征 . 115 表 36“欢迎”论元义类及动词义类特征 115 表 37“欢迎”部分例句语义特征信息标注 117 表 38“盖”的论元角色类型特征 . 119 表 39“盖”的论元义类特征及动词义类特征 119 表 40“盖”部分例句语义特征信息标注 121 表 41 主体论元省略比例抽样统计 123 表 42 客体论元省略比例抽样统计 124 表 43 主体论元承前省略与承后省略比例对比 . 132 表 44 客体论元承前省略与承后省略比例对比 . 133 表 45 主体论元各层级承接性省略比例 135 表 46 客体论元各层级承接性省略比例 136 表 47 主体论元动态层级最常出现位置 137 表 48 客体论元动态层级最常出现位置 138 表 49 主体论元完全省略比例分析 140 表 50 客体论元完全省略比例分析 140 表 51 动词全部论元成分同时省略比例 142 表 52 语料中动词主体论元和客体论元替代现象比例 143 表 53 主体论元替代现象分类统计 145 表 54 客体论元替代现象分类统计 145 表 55 动词重复比例统计 . 147 表 56“关”的《现汉》释义及义类、同义动词表 . 148 表 57“盖”的《现汉》释义及义类、同义动词表 . 149 表 58“送”的《现汉》释义及义类、同义动词表 . 149 vii 表 59“接触”的《现汉》释义及义类 . 150 表 60“满足”的《现汉》释义及义类 . 151 表 61“滚”的《现汉》释义及语义类 . 152 表 62“跌”的《现汉》释义及语义类 . 153 表 63“开”的释义及义类 155 表 64 动态层面义项唯一性抽样动词表 156 表 65 句子层多义动词义项唯一性统计 157 表 66 段落层多义动词义项唯一性统计 161 表 67 段落层多义动词义项唯一性统计 166 表 68 辨义特征出现率抽样动词表 181 表 69“满足”语法特征 182 表 70“满足”论元角色类型特征 . 182 表 71“满足”论元义类限制特征 . 182 表 72“满足”语法特征标注 184 表 73“满足”语义特征标注 185 表 74“关”语法特征描写 186 表 75“关”语义角色类型特征 187 表 76“关”论元义类限制特征 187 表 77“关”语法辨义特征标注 189 表 78“关”语义辨义特征描述 190 表 79 语法辨义特征的出现率统计 191 表 80 小句内语义辨义特征的出现率统计 . 194 表 81 整句内语义辨义特征的出现率统计 . 194 表 82 语段内语义辨义特征的出现率统计 . 195 表 83 语篇内语 义辨义特征的出现率统计 . 196 表 84 固定搭配特征出现率 . 199 表 85 双义项动词语法辨义特征动态权重 . 202 表 86 双义项动词小句内语义及搭配辨义特征权重 203 表 87 双义项动词整句以上语义及搭配辨义特征权重 204 表 88 多义项动词语法辨义特征的动态权重 . 206 viii 词目 义 项号 动词义类 固定搭配 拔 Id 物体状态 ~西瓜 摆 Fa 上肢动作 ~桌椅、~菜 摆 Hj 生活 ~威风、~架子 摆 Fa 上肢动作 ~尾巴、~手 办 Hc 行政管理 ~案、~事 办 Hc 行政管理 ~厂、~教育 办 He 经济活动 ~货 办 Hc 行政管理 严~ 包 Fa 上肢动作 ~伤口 包 Hj 生活 ~工、~场子、~吃住 包 Hb 军事活动 / 包 Jd 存在 无所不~ 包 10 Ka 疏状 ~你满意 包 11 He 经济活动 ~车 保留 Hj 生活 ~节目、~传统 保留 Jd 存在 ~意见 保留 Hj 生活 / 抱 Fa 上肢动作 ~砖头、~住 抱 Ib 生理现象 / 抱 Hi 社交 / 抱 Gb 心理活动 ~想法 背 Kb 中介 ~山 背 Hi 社交 / 背 Hg 教卫科研 ~课文 背 Id 物体状态 ~过脸 奔 Hj 生活 ~亲戚 奔 Id 物体状态 ~三十 奔 Hj 生活 ~货 280 词目 义 项号 动词义类 固定搭配 比 Hh 文体活动 ~输赢、~高低 比 Hj 生活 / 比 Fa 上肢动作 ~手势 比 Kb 中介 / 比 Hj 生活 / 比 Ja 联系 ~作、~成 比 Ja 联系 / 比 Ja 联系 / 编 Hd 生产 ~草席 编 Id 物体状态 ~队、~次序 编 Hg 教卫科研 ~报纸、~论文集 编 Hg 教卫科研 ~故事 编 Hj 生活 瞎~、~谎话 变 Ih 变化 ~样儿 变 Ih 变化 / 变 Ih 变化 / 补 Hj 生活 ~补丁 补 Ih 变化 ~课、~名额 补 Hj 生活 ~身子 采 Fa 上肢动作 ~花、~果子 采 Hd 生产 ~矿 采 Hj 生活 ~样本、~标本 查 Hc 行政管理 ~账、~房、~户口 查 Hg 教卫科研 ~资料、~字典、~数据 查 Hc 行政管理 ~案子 扯 Fa 上肢动作 ~嗓子 扯 Fa 上肢动作 ~破 扯 Hi 社交 瞎~、~闲话 281 词目 义 项号 动词义类 固定搭配 沉 Id 物体状态 ~船、~海里 沉 Id 物体状态 / 沉 Id 物体状态 ~住气、~着脸 吃 Fc 头部动作 ~饭、~东西、~食堂 吃 Hj 生活 ~老本、~集体、~父母 吃 Hb 军事活动 / 吃 Fc 头部动作 ~墨 吃 Je 影响 ~苦头、~拳头、~大亏 串 Ie 事态 ~戏、~台词 串 Hj 生活 ~线、~行 串 Hi 社交 ~亲戚、~门 串 Hj 生活 ~味儿、~色 凑 Ie 事态 ~钱、~整数 凑 Id 物体状态 / 凑 Id 物体状态 ~热闹、~机会 改 Ih 变化 ~时间、~名字、~主意 改 Hg 教卫科研 ~作业、~稿子 改 Hj 生活 ~毛病、~错 盖 Fa 上肢动作 ~被子、~盖子 盖 Fa 上肢动作 ~印、~戳儿 盖 Jb 异同 / 盖 Hd 生产 ~房子、~楼、~猪圈 关 Fa 上肢动作 ~门、~窗户 关 Fa 上肢动作 ~电视、~灯 关 Fa 上肢动作 ~犯人、~鸟 关 If 境遇 ~店铺、~买卖 关 11 Je 影响 事~ 关 12 Hc 行政管理 ~饷、~工钱、~薪水 282 词目 义 项号 动词义类 固定搭配 管理 Hc 行政管理 ~部门 管理 Hc 行政管理 ~图书、~档案 管理 Hc 行政管理 ~牲口、~学生 滚 Id 物体状态 球~、~来~去 滚 Hf 交通运输 给我~ 滚 Ia 自然现象 水~ 滚 Fa 上肢动作 ~元宵、~雪球 送 Hf 交通运输 ~货 送 Hi 社交 ~礼 送 Hi 社交 ~客 283 附录六 138 双义项动词义项距离 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 趴 嚷 0.1882 0.1882 0.1882 借 0.3457 0.3457 哄 0.4152 0.3736 0.0197 煎 0.5173 0.1716 0.3457 栽2 0.5339 0.1882 0.1882 0.3457 扶 0.8493 0.2066 0.5647 揭 0.9884 0.5647 0.3457 画 0.9884 0.5647 0.3457 织 1.03 0.5939 0.3457 向 1.0692 0.2157 0.3493 0.1882 站 1.1569 0.3934 0.5104 0.1882 蹲 1.2171 0.5104 0.1882 0.3457 应付 1.271 0.2826 0.5647 0.3457 掐 1.2854 1.1294 流动 1.3245 0.1836 0.5774 0.0941 0.3457 解释 1.4862 0.4146 0.6041 0.3457 掉2 1.5003 0.7529 0.1882 0.3457 养活 1.5037 0.3796 0.6785 0.0941 0.3457 游 1.6142 0.9553 0.1882 0.3457 发挥 1.7252 1.2235 0.0941 0.3457 撤 1.7252 1.2235 0.0941 0.3457 挡 1.7526 0.1868 1.0213 0.1882 0.3457 藏 1.783 0.0035 0.8869 0.3457 发现 1.8595 0.1868 1.1491 0.3457 284 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 夺 1.8603 0.041 1.3176 0.1882 0.3457 喂 1.8722 1.3477 0.0941 0.3457 抄1 1.8756 1.3261 0.0941 0.3457 夹 1.9363 0.0091 1.3176 0.1882 0.3457 扔 2.0411 0.2218 1.3176 0.1882 0.3457 拆 2.0627 1.1294 0.3457 信 2.126 0.4117 1.1688 0.3457 淘 2.1264 0.1716 1.1294 0.3457 糟蹋 2.2431 0.5179 1.2235 0.0941 0.3457 等于 2.28 0.3736 1.3102 0.3457 钉 2.3243 1.7251 0.1882 0.3457 装1 2.3527 0.4086 1.3767 0.1882 0.3457 研究 2.3679 2.3529 0.0941 0.3457 主持 2.4471 0.5862 1.3373 0.1882 0.3457 搬 2.462 1.8823 0.1882 0.3457 欣赏 2.4912 0.6303 1.3373 0.1882 0.3457 把握 2.497 0.035 1.8823 0.1882 0.3457 支配 2.509 0.047 1.8823 0.1882 0.3457 造 2.5745 0.2066 1.7882 0.0941 0.3457 计算 2.6336 0.1716 1.8823 0.1882 0.3457 探望 2.6746 0.2126 1.8823 0.1882 0.3457 装2 2.6778 2.447 0.1882 0.3457 烫 2.7293 2.0202 0.3457 化装 2.7576 0.1868 3.3882 掩盖 2.7632 0.012 2.2898 0.1882 0.3457 操纵 2.7679 0.3584 1.8079 0.0941 0.3457 拧 2.7866 3.3882 285 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 推翻 2.7891 0.3796 1.8079 0.0941 0.3457 省 2.8235 0.5893 1.5654 0.0941 0.3457 写 2.881 0.3736 1.8361 0.3457 捞 2.8936 1.8823 0.1882 0.3457 欢迎 2.8955 0.5801 1.7138 0.3457 插 2.8965 0.0385 1.8823 0.1882 0.3457 接触 2.9294 2.2045 0.1882 0.3457 揉 2.9504 0.1716 2.6663 0.3457 培养 2.9547 0.5452 1.8079 0.0941 0.3457 掌握 2.9689 0.4237 1.9217 0.1882 0.3457 骗 2.9822 0.3767 2.0563 0.0941 0.3457 理 2.9988 0.2476 2.2898 0.1882 0.3457 了解 3.012 0.4283 1.8823 0.1882 攻击 3.0123 0.5802 1.4043 0.0941 0.3457 听 3.0516 0.0441 2.0847 0.1882 0.3457 安 3.0641 0.1903 2.1307 0.1882 0.3457 冻 3.101 0.1716 2.2045 0.1882 0.3457 淹 3.1194 0.3782 2.0163 0.3457 垫 3.1859 0.0031 2.3272 0.1882 0.3457 搀 3.1868 0.5477 1.7138 0.3457 承认 3.2088 0.7518 1.6718 0.3457 看(kān) 3.2147 0.3736 1.8079 0.0941 0.3457 审 3.2443 3.6434 0.0941 0.3457 托 3.2764 0.1868 2.1307 0.1882 0.3457 裁 3.2798 0.1751 3.5764 0.1882 0.3457 锁 3.2849 3.6443 0.1882 0.3457 讲 3.2998 3.8898 0.0941 0.3457 286 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 制造 3.3331 0.4146 2.1498 0.0941 0.3457 压迫 3.3347 0.1716 2.3656 0.1882 0.3457 划 3.3406 0.1716 3.5240 0.3457 布置 3.3504 0.3736 1.9217 0.1882 0.3457 缠 3.361 0.1782 2.8919 0.1882 0.3457 捧 3.3756 0.5483 1.902 0.1882 0.3457 取 3.3888 0.3782 3.4823 0.0941 0.3457 气 3.4132 0.1868 3.5764 0.1882 捏 3.5197 0.1716 3.3882 0.3457 干2 3.5555 0.1716 3.3882 0.3457 砸 3.561 0.3782 2.8919 0.1882 0.3457 分裂 3.5707 0.1868 3.7104 0.3457 震动 3.6094 0.2126 2.8489 0.1882 0.3457 泡 3.6097 3.9839 0.1882 0.3457 反映 3.6396 0.0091 3.3322 0.1882 0.3457 填 3.7176 3.9839 0.1882 0.3457 滴 3.7393 4.8381 卷 3.751 0.082 4.2790 加入 3.7549 0.2186 3.5764 0.1882 0.3457 抬 3.7696 0.5452 2.3469 0.1882 0.3457 敲 3.7722 0.3934 3.1403 0.1882 0.3457 答应 3.7759 0.5802 3.676 0.3457 拨 3.8333 0.3771 2.8801 0.1882 0.3457 登1 3.8852 0.3736 3.6158 0.1882 0.3457 找 3.8898 0.5635 3.0659 0.0941 0.3457 笑 3.8981 0.7518 3.5961 0.1882 0.3457 牺牲 3.9213 0.3492 3.5764 0.1882 0.3457 287 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 超过 3.968 3.8028 0.0941 0.3457 着(zháo) 3.9832 0.3736 3.6631 0.0941 0.3457 念 3.9908 5.0823 0.3457 批 3.9966 0.3584 3.7307 0.0941 0.3457 选 4.029 0.5452 3.502 0.0941 0.3457 追求 4.0347 0.3736 3.6355 0.1882 0.3457 赔 4.0909 0.2218 4.0441 0.3457 吵 4.1134 0.2066 4.4401 0.3457 求 4.158 0.779 3.6552 0.1882 0.3457 熬 4.1659 0.1751 5.0823 0.3457 转 4.1856 0.4086 3.8439 0.0941 0.3457 犯 4.1999 0.5862 3.5961 0.1882 0.3457 成立 4.2462 0.4404 4.2208 0.1882 0.3457 炸 4.2687 0.2066 3.8969 0.1882 0.3457 洒 4.2732 5.0263 0.1882 0.3457 除 4.3095 0.1868 4.5824 0.1882 0.3457 评 4.3291 0.7076 3.9785 0.3457 降 4.3645 0.1716 4.8381 0.3457 输 4.3865 0.1868 4.147 0.1882 0.3457 升 4.4235 0.5802 3.8242 0.0941 0.3457 谢 4.4448 0.1716 5.0263 0.1882 0.3457 染 4.4684 0.2536 5.2705 0.1882 0.3457 代表 4.4962 0.3735 4.5824 0.1882 0.3457 满足 4.5634 0.5239 4.543 0.1882 0.3457 订 4.6855 0.5452 5.102 0.3457 赏 4.7221 0.4054 5.4248 0.0941 0.3457 劈 4.7332 0.2066 4.5046 0.1882 0.3457 288 动词 义项总 语 法组合 语 义组合 动 词义类 固定搭配 距离 特 征距离 特 征距离 特 征距离 特征距离 闯 4.7451 0.2066 5.5927 0.1882 0.3457 冒 4.8242 0.5452 4.0794 0.1882 0.3457 披 4.9114 0.2066 5.0263 0.1882 0.3457 乘 5.3311 0.3736 6.7401 0.1882 0.3457 称(chēng) 5.4817 0.9156 5.5583 0.1882 0.3457 289 参考文献 中文书目 专书: 陈 昌来 《 现 代汉 语 动 词 的句 法 语 义 属性 研 究 》( 上 海:学 林出 版 社,2002)。 陈 嘉映 译 、 维 特根 斯 坦 著 《 哲 学 研 究 》( 上 海 :上 海 人 民 出版 社 , 2001)。 段 玉裁 《 说 文解 字 注 》 ( 上 海 : 上海 古 籍 出 版社, 1981)。 李 临定 《 现 代汉 语 动 词 》 ( 北 京 :中 国 社 会 科学 出 版 社, 1990)。 李 临定 《 现 代汉 语 句 型 》 ( 北 京 :商 务 印 书 馆, 1986)。 罗 宾斯( R.H.Robins)著 《 简明 语 言学 史 》 ( 北 京 :中 国社 会 科 学 出版 社 , 1997) 页 28, 页 168。 罗 兰 、周 易 合 译 、沙 夫( Adam Schaff)著 《 语 义学 引 论 》( 中 译 本 ) ( 北 京 :商 务 印 书 馆, 1979)。 马 洪海 《 汉 语框 架 语 义 研究 》 ( 北京 : 中 国 社会 科 学 出 版社, 2010)。 马 庆株 《 汉 语动 词 和 动 词性 结 构 》 ( 北 京 :北 京语 言 学 院出 版 社 ,1992)。 梅家驹、竺一鸣、高蕴琦、殷鸿翔编 《同义词词林》 (上海:上海辞书 出 版社 , 1983)。 孟琮、郑怀德、孟庆海、蔡文兰编 《动词用法词典》 (上海:上海辞书 出 版社 , 1987)。 孟琮、郑怀德、孟庆海、蔡文兰编 《汉语动词用法词典》 (北京:商务 印 书馆 , 1999)。 曲 维光 《 现 代汉 语 词 语 级歧 义 自 动 消解 研 究 》( 北 京:科 学出 版 社,2008)。 苏 宝荣 《 词 义研 究 与 辞 书释 义 》 ( 北京 : 商 务印 书 馆 , 2000) 页 141。 王 惠 《 现 代 汉语 名 词 词 义组 合 分 析》 ( 北 京 :北 京 大 学 出版 社 , 2004)。 袁 毓林 《 汉 语配 价 语 法 研究 》 ( 北京 : 商 务 印书 馆 , 2010)。 袁毓林 《基于认知的汉语计算语言学研究》 (北京:北京大学出版社, 2008)。 张 志公 主 编 《 现代 汉 语 》 ( 北 京 :人 民 教 育 出版 社 , 1982)。 290 章 宜华 、 雍 和 明 《 当 代 词典 学 》 ( 北京 : 商 务印 书 馆 , 2007) 页 222。 赵 元任 《 汉 语口 语 语 法 》 ( 北 京 :商 务 印 书 馆, 1979), 页 294。 周 明强 《 现 代汉 语 实 用 语境 学 》 ( 杭州 : 浙 江大 学 出 版 社, 2005)。 朱 德熙 《 语 法讲 义 》 ( 北 京 : 商 务印 书 馆 , 1982)。 论文: 陈 浩 、何 婷 婷 、姬东 鸿 ,见《 中 文 信 息 学报 》 第 期 , 2005 年 , 页 10-16。 符 淮青 , 见 《 汉 语学 习 》 第 期 , 1999, 页 1-5。 洪 诗楣 ,國 立 交 通 大 學 硕士 论 文 , 2009 年 。 黄 昌 宁 、 童 翔 , 见 《 语 言 文 字 应 用 》 第 期 , 1993 年 。 江 亭 仪 , 国 立 交 通大 学 硕 士 论文, 2009 年 。 金 定元 ,见《 中 国语 文 天 地》第 期 ,1986。 李 涓子 ,清 华 大 学 计 算机 科 学 系( 博 士 学 位 论文 ), 1999。 廖 秋忠 , 见 《中 国 语 文》 第 期 , 1984 年 , 页 28-36 林 进展 、王 惠 ,见《 云 南 师 范 大学 学 报 》 (哲学 社 会科 学 版 ) 第 期 , 2010 年 。 刘 群 、李 素 建 ,见 http://www.keenage.com/papers, 2003。 鲁 松 、 白 硕 、 黄 雄 、 张 健 , 见 《 计 算 机 研究 与 发 展 》 第 期 , 2001 年 , 页 662-667。 马 庆株 ,见《 中 国语 文 》第 期 ,1981 年 ,页 86~90。 马 庆 株 , 见 《 中 国 语 言 学 报 》( 三 ) ( 北 京 : 商 务 印书 馆 , 1988)。 濮 侃、庞 蔚 群 ,见《 华 东 师 范大 学 学 报 》第 期 ,1990, 291 页 36-43。 邱 子 玲 , 国 立 交 通 大 学 硕 士 论文 , 2009 年 。 苏 新春 、李 安、洪 桂治 ,见《 厦 门 大学 学 报 (哲 社 版 》 第 期 , 2010 年 , 页 137-144。 王 德春 ,见《 语 境研 究 论 文 集 》 ( 北 京 :北京 语 言学 院 出 版社 , 1992), 页 46-61。 王 建华 ,见《 语 境 研究 论 文 集 》 ( 北 京 :北 京 语 言 学 院出 版 社 , 1992), 页 343。 王 建平 ,见《 语 境 研 究论 文 集 》 ( 北 京 :北 京 语 言 学院 出 版 社 , 1992), 页 6-25。 吴 云 芳 、 俞 士 汶 , 见 《 语 言 文 字 应 用》 第 期 , 2006 年 月 , 页 126-133。 西 槙光 正 , 见 《 中国 语 文 》 第 期 , 1991, 页 18-37。 袁 毓林 , 见 《世 界 汉 语 教学》 第 期 , 2002 年 , 页 10-22。 张 丽丽 、陈 克 健 、黄 居 仁 , 见 《中 文 计 算 语 言 学 期 刊 》 Vol.5 No.1, 2000, 页 1-18。 英文书目 Books: Agirre, E., & Edmonds, P. G. (eds.), Word sense disambiguation: algorithms and applications. Dordrecht: Springer. 2006. Gruber, J.S., Lexical structures in syntax and semantics, Amsterdam ; New York : North-Holland Pub. Co.: Sole distributors for the U.S.A. and Canada, Elsevier/North Holland, 1976. Halliday, M.A.K & Hasan, R., Cohesion in English, London: Longman Press, 1976. Halliday, M.A.K and Hasan, R., Language, context and text: aspects of language 292 in a social-semiotic perspective. Deakin University Press: Deakin University, Geelong, 1985. Hoey, M., Patterns of lexis in text. Oxford : Oxford University Press, 1991. Johnson, C. R., Fillmore, C. J., Wood, E. J., Ruppenhofer, J., Urban, M., Petruck, M. R. L., et al., The FrameNet Project: Tools for lexicon building (Version0.7), Available from http://framenet.icsi.berkeley.edu/, 2001. Levin, Beth, English verb classes and alternations : a preliminary investigation, Chicago: University of Chicago Press, 1993 Mei-Chun Liu, Mandarin Verbal Semantics: A Corpus-based Approach, Taipei: Crane Publishing Co., 2001 Ogden, C. K. & Richards, I., A.The meaning of meaning : a study of the influence of language upon thought and the science of symbolism, London : Ark Paperbacks, 1985 Sinclair, John (ed.), Collins Cobuild English language dictionary, London: Collins, 1987. Articles: Ahrens, Kathleen, Li-Li Chang, Keh-jiann Chen, Chu-Ren Huang, "Meaning Representation Computational and Meaning Linguistics Instantation and Chinese for Chinese Language Nominals", Processing, 1998.3,pp.45-60. Chu-Ren, Huang & Ahrens, Kathleen, "The Module-Attribute Representation of Verbal Semantics". In Working Papers on Chinese Verbal Semantics, Vol.I. Corpus Research Group, Institute of Linguistics, Academia Sinica, and Chinese Knowledge Processing Group, Institute of Information Science, Academia Sinica. Taipei.pp109-116. Dagan, I., & Itai, A., “Word sense disambiguation using a second language monolingual corpus”. Computational Linguistics, 20(4), 1994, pp.563-596. Dowty, D., “Thematic Proto-Role and Argument Selection”. Language, Vol. 67, No.3. 1991. 293 Fillmore, Charles J., "Frame semantics". In The Linguistic Society of Korea, eds. Linguistics in the Morning Calm. Seoul: Hanshin. 1982, pp.111-37. Fillmore, Charles J., "Scenes-and-frames semantics". In A. Zampolli, ed. Linguistic Structures Processing. Amsterdam: North-Holland,1977, pp55-81. Fillmore, Charles J., “The Case For Case”. Universals in Linguistic Theory, ed. By Emmon Bach and Robert T. Harms,. New York: Holt, Rinehart & Winston.1968, pp.1-90 Gale, A. William, Kenneth W. Church and David Yarowsky, “A Method for Disambiguation Word Senses in a Large Corpus”. Computer and the Humanities. 26, 1993, pp.415-439. Gale, A. William, Kenneth W. Church and David Yarowsky, “Using bilingual materials to develop word sense disambiguation methods”. In: The International Conference on Theoretical and Methodological Issues in Machine Translation. 1992, pp101-112. Gonzalo, J., Verdejo, F., & Chugar, I., “The Web as a Resource for WSD”. In Proceeding of 1st MEANING Workshop. 2003.pp106-113 Ide, N., & Wilks, Y., “Making Sense About Sense”. Word Sense Disambiguation, Dordrecht: Springer, 2006, pp.47-73. Ido, Dagan, Alon Itai and Shaul Markovitch, “Two Languages Are More Informative Than One”. In The 29th Annual Meeting of Association for Computational Linguistics. Berkeley. CA: ACL. 1991. pp130-137. Kilgarriff, A. “’I Don’t Believe in Word Senses’”. Computers and the Humanities, 31(2), 1997, pp.91-113. Kilgarriff, A. “The Hard Parts of Lexicography”. International Journal of Lexicography, 11(1), 1998, pp.51-54. Kilgarriff, A., & Grefenstette, G., “Introduction to the Special Issue on the Web as Corpus”. Computational Linguistics, 29(3), 2009, pp.333-347. Kilgarriff, A., “Dictionary word sense distinctions: An enquiry into their nature”. Computers and the Humanities, 26(5), 1992, pp.365-387. Lesk, Michal, “Automatic sense disambiguation: How to tell a pine from an ice 294 cream cone”. In Association for Computing Machinery. eds. The 1986 SIGDOC Conference. New York. ACM. pp.24-26 Lin, Charles Chien-Jer, & Ahrens, Kathleen, "Calculating the Number of Senses: Implications for Ambiguity Advantage Effect during Lexical Access", Seventh International Symposium on Chinese Language and Linguistics Proceedings, 2000, pp.141-156. Resnik, Philip., Selection and Information: A Class-Based Approach to Lexical Relation. [Ph.D. Dissertation], USA: University of Pennsylvania. 1993. Sussna, Michael., “Word sense disambiguation for free-text indexing using a massive semantic network”. In Proceedings of the Second International Conference on Information and Knowledge Management (CIKM-93), Arlington, VA., 1993, pp.67-74. Tufi, D., Ion, R. & Ide, N. “Fine-Grained Word Sense Disambiguation Based on Parallel Corpora, Word Alignment, Word Clustering and Aligned Wordnets”. Paper presented at the Proceedings of Coling 2004.pp23-31. Voorhees, E. M., “Using WordNet to disambiguate word sense for text retrieval”. In Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval. Pittsburgh, PA USA, 1993, pp.171-180. Wang, Y. & Huffmann, A. “Bootstrapping Word Sense Disambiguation Using Dynamic Web Knowledge”, PRICAI 2006: Trends in Artificial Intelligence, 2006, pp.1150-1154 Yarowsky, David., “Decision Lists for Lexical Ambiguity Resolution: Application to Accent Restoration in Spanish and French”. In The 32nd Annual Meeting of Association for Computational Linguisitcs. Las Cruces. NM: ACL. 1994, pp88-95. 295 [...]... Corpus of Chinese Teaching Materials as a database In the static level, all the attributes of grammatical combination, semantic combination and collocation of each sense of the verbs, which are the distinctive features in verb sense recognition, is analyzed and described With statistics of the their distribution in the table of the external attributes of verb sense, the importance degree of each distinctive... 217 x ABSTRACT The paper address a pattern of Chinese verb sense recognition in context Verb sense recognition is a procedure and mechanism to distinguish the sense of each polysemous verb in certain context There are two levels in the pattern of Chinese verb sense recognition: the static level and the dynamic level The study select 329 polysemous verbs of Chinese as a sample, and take the sense tagged... grammatical features, arguments as semantic role and other verbs that are semantically and structurally related to the polysemous verb Moreover, the importance degree of each distinctive features in distinguishing the verb senses in the dynamic level is contrasted and arranged In addition, in consideration of the impact on automatic verb sense disambiguation from the Lexicographic division of verb sense, ... sense, a method of measuring the distance between senses of a verb, which can be the reference criterion of dividing senses of a verb, is demonstrated In conclusion, each type of distinctive features play a different role in the pattern of verb sense recognition In the static level, the collocation, objective argument and semantic type of verb are the most important features In the dynamic level, the leading... it is hard because of the lack of distinctive features With statistics of the features’ distribution in the three context levels of sentence, paragraph and whole text in the corpus, the tendency of the xi distinctive features’ position in each context levels is analyzed On basis of this analysis, it becomes clear that a polysemous verb sense can be disambiguated with all types of distinctive features... distinctive features in distinguishing the verb senses in the static level is contrasted In the dynamic level, some of the distinctive features can be omitted or substituted by pronoun or located on different place of a text and outside the minor sentence, on which a particular polysemous verb is located, therefore the verb sense has to be recognized in a larger range in text than in a minor sentence and sometimes... important features In the dynamic level, the leading features are the object-argument, collocation, complement type, subject-argument, and semantic type of verb The study of verb sense recognition is meaningful and worthwhile in the area of lexicography and word sense disambiguation Key words: Verb Sense Recognition, Polysemous Verb, Distinctive Features xii 汉语多义动词义项辨识模式 第一章 绪论 1.1 课题的提出 词汇歧义在自然语言使 用中是比较普遍的现象。在日常阅读中我们不... 击打)和 break ( (打 破)两个动词的句法表现中发现它们分别属于两类不 同的动词:break 类动 词表示物体状态的变化,例如:shatter(砸碎) 、fold(折叠) 、bend(弄弯) ; 而 hit 类动词表示接触,不含物体状态的变化,例如:strike(击打) 、slap (拍打) 、bump(猛击) 。后来许多学者都通过动词的语法功能结合动词的 语义特征对动词进行各种分类。 Levin(1993)也从动词的语法表现,也就是在句法组合特征中的替换 (alternation)入手,系统地寻找语法形式背后的语义特征。通 过对英语中 4 个动词的语法表现进行考察,发现它们的论元结构不同,分别代表 4 类 不同的动词: Break 类:break, crack, rip, shatter, snap … Cut 类:cut, hack, saw, scratch, slash … Touch... 和“交际者”作为语言环境的三个组成部分,并认为语言环境的这三个组 1976) 成部分的每一部分的改变, 都可以产生新的语域。 Halliday & Hasan, ( 另外,他在弗斯理论基础上 对“搭配” (collocation)进行了探讨,将“搭 配” 定义为 “共现趋势” co-occurrence tendency) Halliday & Hasan ( 。 (1976) 认为,如果一组词汇义项具有相同的词汇环境,它们之间就存在一种搭配 7 关 系 , 如 “ laugh joke, blade sharp, garden dig, ill doctor” 它 们 既 , 不 是 如“ laugh” 和 “ smile” 那 样 的 同 义 词 , 也 不 是 “ sharp” 和 “ blunt” 那样的反义词,同时也不是“doctor”和“ patient”那样的对义词,但它们 经常相邻出现,因而它们之间存在搭配关系。在他们看来,形成搭配最重... slash … Touch 类:pat, stroke, tickle, touch … Hit 类:bash, hit, kick, pound, tap, whack … 17 而这四类动词分别有其特定的语义特征: Break 类:CAUSE, CHANGE Cut 类: CAUSE, CHANGE Touch 类:CONTACT Hit 类: CONTACT, MOTION 由此,Levin(1993)提出“动词的句法行为,尤其是其 论元表达在很 大程度上决定于动词的意义” 。 Levin(1993)根据英语动词的语法功能和语义特征,将 3000 多个英 语动词分为 49 个大类,172 个小类 。而其中,多义动词的不同义项也被归 入到不同的动词类中。例如动词“hug”义项①“搂抱,拥抱”属于 Marry 类(包括 date, divorce, embrace, kiss 等动词) ,而义项②“靠近走;靠岸行” . take the sense tagged Corpus of Chinese Teaching Materials as a database. In the static level, all the attributes of grammatical combination, semantic combination and collocation of each sense. verb sense can be disambiguated with all types of distinctive features in the context: the grammatical features, arguments as semantic role and other verbs that are semantically and structurally. lexical semantics, pragmatics, and cognitive grammar. In addition to the above, I also want to show great gratitude to my family members and friends, who give me warmth, encouragement and happiness.

Ngày đăng: 09/09/2015, 18:56

Mục lục

  • 封面COVER

  • Thesis论文修改版2012_LINJZ

Tài liệu cùng người dùng

Tài liệu liên quan