《機(jī)器翻譯概論》由會(huì)員分享,可在線閱讀,更多相關(guān)《機(jī)器翻譯概論(21頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,*,*,第十章,第一節(jié) 機(jī)器翻譯概論,1.機(jī)器翻譯,2.機(jī)器翻譯的應(yīng)用,概念,機(jī)器翻譯(machine translation),又稱機(jī)譯(MT),是利用計(jì)算機(jī)把一種自然語言轉(zhuǎn)變成另一種自然語言的過程。用以完成這一過程的軟件叫做機(jī)器翻譯系統(tǒng)。,國外機(jī)器翻譯歷史,國外機(jī)器翻譯的發(fā)展歷史:,20紀(jì)30年代初,法國科學(xué)家G B阿爾楚尼最早提出機(jī)器翻譯的設(shè)想。,1946年,英國和美國的兩位工程師在1949年出版了翻譯備忘錄一書。,1954年 年,美國喬治敦大學(xué)和國際商用機(jī)器公司(IBM)首次聯(lián)合試驗(yàn)使用電腦機(jī)譯系統(tǒng)
2、,并將由250個(gè)詞組成的簡單的俄文材料譯成了基本上可以接受的英文。,這次試驗(yàn)的成功標(biāo)志著機(jī)器翻譯系統(tǒng)的真正誕生。,中國機(jī)器翻譯歷史,1956年我國開始研究機(jī)器翻譯。,1987 年中國軍事科學(xué)院成功研制出“科譯 4 號(hào)”,這標(biāo)志著我國機(jī)譯系統(tǒng)從無到有。,1967-1976年的沉寂期,1997 年底,東方快車以“智能漢化”為口號(hào),在國內(nèi)掀起翻譯軟件的高潮。,1988年是中國翻譯軟件最紅火的一年,國內(nèi)出現(xiàn)了通譯、譯星、朗道、即時(shí)通、漢神、Internet寶典等幾十種翻譯軟件。,機(jī)器翻譯方法分類,(1),基于規(guī)則分析,,就是對(duì)源語言語句,的詞法、語義、語法和句法進(jìn)行分析并進(jìn)行判斷和取舍,然后重新進(jìn)行排
3、列組合,最后生成目標(biāo)語言。這一系列過程均是模仿人腦進(jìn)行翻譯的過程。,2),基于語料庫技術(shù),,工作原理是利用統(tǒng)計(jì)學(xué)和,概率方法建立一個(gè)包含各種句型的雙語對(duì)照語料庫。,基于規(guī)則的機(jī)器 翻 譯(Rule-Based),:,直接翻譯法,,即輸入形態(tài)分析雙語字典查詢?cè)~序調(diào)整輸出;,轉(zhuǎn)換系統(tǒng);基于中間語的機(jī)器翻譯,逐詞進(jìn)行翻譯,又稱逐詞翻譯法:翻譯效果差,屬于早期過時(shí)認(rèn)識(shí),現(xiàn)已無人采用:,How are you?,怎么是你?,How old are you?,怎么老是你?,基 于 語 料 庫 的 方 法(Corpus-Based):,基于實(shí)例的機(jī) 器翻譯EBMT,(,example-based machi
4、ne translation,),統(tǒng)計(jì)機(jī)器翻譯SBMT,(,statistics-based machine translation,):,如翻譯引擎,機(jī)器翻譯的缺陷,以至于近來有人說“MT,不是machine translation的縮寫,而是mad translation(瘋子的翻譯)的縮寫”。,雖然機(jī)器翻譯歷經(jīng)了70多年的研究,機(jī)譯的譯文質(zhì)量確實(shí)還是不能令人滿意。,從語言文化角度,每個(gè)國家都有其獨(dú)特的文化,文化的差異形成于歷史沉積,滲透于生活的方方面面。,機(jī)器翻譯在進(jìn)行翻譯過程中遇到英漢之間文化差異和文化障礙,通過“金山快譯”和“東方快車”這兩種常用的翻譯軟件來舉例說明:這是機(jī)器翻譯的一
5、個(gè)缺陷,也是其重要的薄弱點(diǎn)。,She is a fox.,機(jī)器翻譯:她是狐貍.,機(jī)器翻譯對(duì)這個(gè)句子進(jìn)行了直接字面翻譯,似乎沒有錯(cuò)。在中英文中,“狐貍”一詞都可以與狡猾或詭計(jì)多端的人聯(lián)系在一起。,但是“當(dāng) 狐貍”一詞與女性聯(lián)系在一起時(shí),漢語與英語卻分別具有了不同的色彩和暗示。,按照中國人的心理“狐貍”形容女性是貶義,指“狐貍精”,這無疑是錯(cuò)誤的,因?yàn)樵谟⒄Z中“FOX”形容女性是指時(shí)髦迷人的女子。,如果直譯為“:她是只狐貍”,便容易在中國讀者心中喚起一種傳統(tǒng)上遭到貶斥的形象。,參考譯文:,她是位時(shí)髦迷人的女郎,。,狗嘴里吐不出象牙,機(jī)器翻譯:No ivory issues from the mou
6、th of a dog.,在漢語中有關(guān)狗的詞語往往帶有貶義色彩,然而在英語國家中,狗被普遍認(rèn)為是人類最忠誠的朋友,對(duì)狗的忠誠大加贊賞,因此如果在這個(gè)句子中,把狗直譯為 dog,會(huì)產(chǎn)生文化色彩的變異。,在這里機(jī)器翻譯忽略了“狗”(dog)在中英的特殊文化意義。對(duì)這個(gè)句子大家比較接受的翻譯為:,A filthy mouth cant utter decent language.,天有不測(cè)風(fēng)云,機(jī)器翻譯:A wind and cloud may arise from a clear sky.,漢語中的“風(fēng)云“一詞如果照字面直譯為英語中的 wind and cloud,那么英語讀者是很難體會(huì)出“風(fēng)云”
7、一詞所包含的文化內(nèi)涵的。,“風(fēng)云”一詞在漢語中可以用來比喻“不安定的,多變的局勢(shì)”,比如“風(fēng)云變幻”,“風(fēng)云突變”等詞組中的“風(fēng)云”都包含有這一層的含義。為了便于英語讀者的理解,應(yīng)當(dāng)根據(jù)其真正的文化意義來真實(shí)再現(xiàn)原文信息:,參考譯文:,Something unexpected may happen any time.,從語言語法角度,We dont read books for amusement.,機(jī)器翻譯:我們?yōu)榱讼捕蛔x書。,原文中的 not位于 read 前,形式上是否定謂語,而在實(shí)際意義上是否定后面的 for amusement,原文的正常語序應(yīng)是:We read books no
8、t for amusement.,但英語中習(xí)慣把 not提到前面去,這叫“否定前置”。又如我們常說的“:我們活著不是為了吃飯,而吃飯是為了活著”,譯為英語就是:We do not live to eat but eat to live.原譯單純?cè)谛问缴吓c原文相對(duì)應(yīng),但意思卻完全錯(cuò)誤。,參考譯文:,我們讀書不是為了消遣。,他有兩米高。,機(jī)器翻譯:He has two meters high.,這就是我們經(jīng)常所說的 Chinglish(中式英語)現(xiàn)象,機(jī)器翻譯也同樣出現(xiàn)了這種問題,只懂得按字面意思翻譯。,have(has)是“有”的意思,表示擁有某物,具有所屬的關(guān)系。但是漢語中的“有”不能完全等同
9、于“have(has)”。他“有”兩米高表示他的特征,本身所具有的屬性,不能按照字面進(jìn)行直譯。,參考譯文:,He is two meters high.,從語言上下文聯(lián)系角度,不勝慚愧。,機(jī)器翻譯:It is ashamed very。,這句話的上下文若是為自己有缺點(diǎn),做錯(cuò)了事或未能盡到責(zé)任而感到不安,此句應(yīng)譯為“I feel quite ashamed.”,但其上下文若是受人贊揚(yáng)而表示自謙,則此句話只具備語用意義,應(yīng)譯為“,I feel greatly flattered.”,數(shù)碼相機(jī),機(jī)器翻譯,:,數(shù) ,這里“數(shù)碼相機(jī)”翻譯成“數(shù) ”,日本人是不會(huì)懂的。,參考譯文,:,機(jī)器翻譯的優(yōu)點(diǎn),機(jī)器
10、翻譯是科技翻譯,尤其是各具體學(xué)科、專業(yè)翻譯的最佳途徑。因?yàn)檫@類翻譯句式結(jié)構(gòu)較為簡單,專業(yè)詞匯重復(fù)量大,而機(jī)器翻譯速度快、效率高,完全可以在這方面大顯身手。,1.These tests determine if the subsystem has a problem.,機(jī)器翻譯:這些測(cè)試確定子系統(tǒng)是否有問題。,非文學(xué)出版物的機(jī)器翻譯一直在進(jìn)行,產(chǎn)品說明書、天氣預(yù)報(bào)等一些基于專業(yè)語料庫的材料的翻譯效果還是不錯(cuò)的。例如,蒙特利爾大學(xué)研制的英法翻譯系統(tǒng)進(jìn)行天氣預(yù)報(bào)的自動(dòng)翻譯,多年來每天自動(dòng)翻譯1,5002,000份天氣預(yù)報(bào)材料,具有很強(qiáng)的實(shí)用性。,世界上有70%以上的網(wǎng)站都是用英文編寫的,而只有12%
11、13%的網(wǎng)站是由漢語編寫而成的。,互聯(lián)網(wǎng)以及與計(jì)算機(jī)相關(guān)材料的翻譯很大一部分依賴機(jī)器翻譯。機(jī)器翻譯在這方面發(fā)揮著機(jī)器輔助翻譯所不能比擬的作用。,目前有多種網(wǎng)絡(luò)資源可以提供詞匯、專有名詞、例句、文化背景等資料檢索功能,大大方便了翻譯學(xué)習(xí)和研究,并為翻譯教學(xué)提供新的思路。,常見的資料檢索渠道有搜索引擎、在線詞典(如金山在線)、在線百科全書(如維基百科等)、雙語平行語料庫(如中國譯網(wǎng)、句酷等)。,人類對(duì)自然語言的認(rèn)識(shí)是無盡的,對(duì)機(jī)器翻譯的研究也是無盡的。不管怎么說,機(jī)器翻譯的速度卻是無可置疑的,因此我們必須相信機(jī)器翻譯的質(zhì)量將會(huì)越來越好,越來越成熟。,我們不能完全依賴于機(jī)器翻譯,最多把機(jī)器翻譯當(dāng)做一種參考,一份“草稿”,再進(jìn)行人工翻譯的思考與修改。,