论信息化时代的汉英英汉机器易胜博备用网址研究

来源:  作者:本站

随着知识经济的兴起和计算机技术的迅猛发展,人类正在步人一个信息化时代,语言是信息最重要的载体。为满足不同国家和地区人们信息交往的需要,机器易胜博备用网址被提到重要议事日程。由于英语的国际语言地位,汉英英汉易胜博备用网址已成为当前非常迫切的研究课题。
英汉汉英机器易胜博备用网址就是利用计算机进行英汉两种语言的互译。我国是世界上继美国、前苏联、英国会进行机器易胜博备用网址研究的第四个国家,早在1957年,中科院语言研究所成立了英汉机器易胜博备用网址研究组,与北京外国语学院合作研究英汉机器易胜博备用网址。十一届三中全会以后,我国的汉英英汉机器易胜博备用网址进人了新的发展时期。1978年,在中科院计算所III计算机上进行了英汉题录机器易胜博备用网址试验。中国人民解放军军事科学院研制成功实用型全文与题录兼容英汉机器易胜博备用网址系统,并于1987年通过技术鉴定,1988年由中国软件技术公司实现了商品化,命名为“译星1号”,成为当年计算机界十件大事之一。汉英英汉机器易胜博备用网址取得了突破性的进展,开始向实用化、商品化、产业化迈进。目前,我国软件市场上流行的金山词霸、快译通、东方快车等英汉汉英机器易胜博备用网址软件为不会英语的人进行外语交际和实现网上交流提供了极大的方便。
经过四十多年曲折的历程,我国英汉汉英机器易胜博备用网址取得了很大的成就,但不可否认的是,目前的英汉汉英机器易胜博备用网址实用软件还大多停留在词处理阶段,对句子一级的易胜博备用网址还存在很大限制,易胜博备用网址的句子不堪卒读。在初期,计算机的处理和存储能力是制约英汉汉英机器易胜博备用网址的瓶颈。现在,随着计算机软硬件技术的迅猛发展,对汉语的研究不足成为制约英汉汉英机器易胜博备用网址发展的新的瓶颈。


与西方印欧语言相比,汉语有很多不同的特点,汉语语法理论是在西方语言理论的基础上建立的,经过百年来的发展,在分析和解释汉语方面做出一定的贡献,但仍然存在着圆柏难通的问题。应用于机器易胜博备用网址,现代汉语语法分析的难点主要是:
1.词的切分。汉语是不分词连写的,不象英文那样词与词之间有空格分开。比如一个语言片段“观测试”,如果没有一定的语义知识,就不知道拆分成“观测一试”还是“观一测试”。目前的切词系统的正确率可以达到97%以上,但对于汉英英汉机器易胜博备用网址来说还远远不够,因为机器易胜博备用网址系统一般是以句子为单位进行处理的,一处切词错误将导致整个句子的易胜博备用网址错误,切词阶段的错误率在易胜博备用网址过程中将会被放大。如果一个切词系统的错误率只有2%,那末在一篇1000词的文章中,可能出现20处切词错误。
2.未登录词的识别。在英汉汉英机器易胜博备用网址中,未登录词就是词典里没有的词。如一些人名、地名、机构名、外语音译词等没有收在词典里,这就给计算机进行词语匹配时带来很大困难。更难的是人们在命名时对名字赋予了一些意义,名字本身又可以成词,比如“宁静”可以作人名,也可以作形容词。
上一页12 3 4 下一页
关于本站 | 会员服务 | 隐私保护 | 法律声明 | 站点地图 | RSS订阅 | 友情链接 免责声明:凡本站注明来源为xx所属媒体的作品,均转载自其它媒体转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。