越南语中文互译语音器(中英互译语音在线翻译)


利用概率模型训练、学习得到基于字形的汉越音译知识,实现汉语和越南语的人名音译。音译方法简单有效,在汉译越上效果尤为显著,准确率达到97.41%。

广西科学院学报J un l fGu n x a e yo ce c s o r a a g i o Ac d m fS in e

2 1 2 ( ): 3~ 4 2 0 0, 6 4 4 9 4V o1 6, .2 No. N o e b r 2 0 4 v m e 01

基于概率模型的汉语和越南语的人名音译方法Th e App o c fChi s‘ e na e e Na e r a ho ne e- t m s m ViTr ns ie a i n Ba e n Pr ba ii tc M o e a lt r t0 s d o 0 b ls i d l中文明刘连芳。黄家裕。温家凯 ,,,SHEN e: n L U a—a g, u n i— u, EN i— a W n mig, I Lin f n H a gJa y W Jak i ( .西大学计算机与电子信息学院,西南宁 1广广西南宁 5 00 ) 3 0 7

5 0 0;.宁平方软件新技术有限公司, 30 42南广

(1 Cole e . l g of Comput r nd e a Elc r ni I or a i n, Gua gxi e t o c nf m to n Uni e st v r iy, Na i nn ng, Gua ngx,53 0 4,Chi a; 2.Pi gs f Ne i 00 n n ot w Te hn o y c ol g Co. Lt d.of Na i nn ng,Na i nn ng,

Gu n x, 3 0 7, i a a g i 5 0 0 Ch n )

摘要:用概率模型训练、习得到基于字形的汉越音译知识,现汉语和越南语的人名音译。音译方法简单利学实有效,汉译越上效果尤为显著,确率达到 9.1。在准 74 关键词:越人名翻译音译概率模型音译知识汉中图法分类号: P 9 . T 3 12文献标识码: A文章编号: 0 27 7 ( 0 0 0—4 9 0 10—3 8 2 1 )40 3—4Ab t a t: p ob biitcm o li e o ge he ta l e a i nf r a i n o s r c A r a ls i de Sus d t tt r ns i r ton i o m to fChi e e Vit t n s- e—na e e b s d n gr p m e n t e r n l to be w e n m s a e o a he a d h t a s a i n t e Chi s a d

ne e n V it m e e e na s na e S m i

b s d o h s i f r to . e a p o c s sm p e a d e f c i e e p c a l n Ch n s— o Vi a e n t i n o ma i n Th p r a h i i l n fe tv, s e i l o i e e t—— ye n m e e t a s ie a i n, n he p e ii n r t e c s 9 . . t a s r n lt r to a d t r c so a e r a he 7 41

Ke r:Ch ne e Vit me e na r n l ton, r n lt r to p o biitc m o 1 t a s y wo ds i s— e na s me t a s a i t a s ie a i n, r ba ls i de, r n—lt r to nf m a i n ie a i n i or to

随着世界经济文化的融合,量的外来词纷纷大

据重要地位。

涌现到本土文化中,些外来词多为命名实体:这人名、名和机构名等。外来词只有部分可以直接使地用,部分都需要进行翻译。翻译外来词的方法主大要有两种:译和音译。意译是根据词语的意思把意

越南语中文互译语音器

根据音译方法的不同,译被分为基于语音音 ( h n meb sd的音译和基于字形 ( rp e— p o e—a e ) ga h me b sd的音译 _。基于语音的音译需要 3个转换步 ae )】]

骤:首先将源语言词语转换成其发音符号 (素)然音,后再转换为目标语言的近似音素,后再转换成目最标词语。基于语音的音译需要通过机器学习来获取

词语从一种语言翻译到另一种语言,音译是根据而其发音来翻译的。例如“ e iii”翻译为“霉 P ncln, l青素”意译方法,是翻译为“尼西林”音译方法。由盘是

转换规则,换过程中信息容易丢失,且多个步骤转并错误的累加会影响整个音译的准确率。基于字形的音译是将源语言词语按照字形单元的匹配直接转换为目标语言词语,如从人名“ mi”“密斯”例 s t和史 h训

于命名实体是一个开放集,难在词典中来获得相很应翻译,因此主要使用音译方法来翻译。命名实体的音译在机器翻译、跨语言信息检索、多语言

命名实体对抽取、平行语料库对齐等自然语言处理领域占收稿日期:000—6 2 1—81修回日期:0 01—3 2 1—01

练得到“——h直接对应着“一斯” smi” t史密一。基于字形的音译方法将基于语音的 3个步骤简化成 1个步骤,少了中间过程对整体音译性能的影响,而提减从高了音译的准确率口。基于字形的音译方法是近些]年的研究热点,主要是在联合信源通道、噪声通道等原有音译模型的基础上引入新的特征来改进音译的

作者简介:申文明( 9 4)男,士研究生, 18一,硕主要从事信息检索和自然语言处理研究。

越南语中文互译语音器

+技部 21年度科技型中小企业创新基金 ( 0 21521 )科 00 1 C 6 4 0 8 8资助。

性能,比如音译单元相对距离、键字信息、下文关上

第1页

下载原格式 pdf 文档(共 1 页)

微信支付宝

付费下载

本文收集自互联网,如果发现有涉嫌侵权或违法违规的内容,请联系6532516@qq.com以便进行及时清除。
分享到