《計算機輔助翻譯概述課件》由會員分享,可在線閱讀,更多相關《計算機輔助翻譯概述課件(25頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,2019-3-16,2019-3-16,#,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,單擊此處編輯母版標題樣式,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,單擊此處編輯母版標題樣式,單擊
2、此處編輯母版文本樣式,第二級,第三級,第四級,第五級,#,計算機輔助翻譯,Computer Aided Translation,1,2019-3-16,2019-3-16,計算機輔助翻譯Computer Aided Trans,工欲善其事,必先利其器,。,論語,衛(wèi)靈公,君子生非異也,善假于物也,。,荀子,勸學篇,參見短片,:,1,電腦為你實時翻譯:新技術,新生活,感受技術的魅力(二),為什么要學習翻譯技術,生產(chǎn)工具的重要意義,生產(chǎn)工具是生產(chǎn)力的主要標志,生產(chǎn)工具在生產(chǎn)力的發(fā)展中起著決定性的作用,生產(chǎn)力的質(zhì)的飛躍是以生產(chǎn)工具的重大變革為先導的。,社會發(fā)展簡史,為什么要學習翻譯技術生產(chǎn)工具的重要意
3、義,為什么要學習翻譯技術,身處信息時代,任何職業(yè)都離不開計算機技術,翻譯行業(yè)當然也不例外,。(參見短片:,MIIS,計算機輔助翻譯課程介紹),掌握翻譯技術,可能對求職是一個優(yōu)勢,。全球化帶來了,前所未有的翻譯,需求(,非文學文本占到了翻譯總量的,95%(,李長栓,2004),,如,本地化的特點:,量大、時間緊迫。傳統(tǒng),的翻譯手段難以滿足需要。,正確使用翻譯技術能有效提高你的工作效率,為你帶來效益,。,倍增,生產(chǎn)力,提高翻譯速度,提高翻譯質(zhì)量,降低勞動強度,為什么要學習翻譯技術身處信息時代,任何職業(yè)都離不開計算機技術,語言服務,人才技能,語言基礎,交流溝通,行業(yè)知識,項目經(jīng)驗,職業(yè)道德,IT,技
4、術,現(xiàn)代,語言服務人才,素質(zhì)需求,語言服務語言基礎交流溝通行業(yè)知識項目經(jīng)驗職業(yè)道德IT技術現(xiàn)代,過硬的英中文表達、轉(zhuǎn)換能力,信息技術基礎知識,熟練利用,多種網(wǎng)絡檢索技術來獲取信息和知識,熟練掌握各,類,輔助,翻譯,/,電子,工具,熟練基本的翻譯,規(guī)則和,流程,知識,廣博,,并且,精通,某一行業(yè)領域的知識,能夠承受工作壓力,按照客戶要求及項目計劃控制項目進度和質(zhì)量,團隊,協(xié)作精神貫穿,整個翻譯工作流程,,翻譯、編輯、校對、,工程、測試,等,恪守職業(yè)道德,,,敬業(yè)態(tài)度、忠誠、責任心,、細心、保密 安全,新一代語言服務人才素養(yǎng)要求,新一代語言服務人才素養(yǎng)要求,2019-3-16,6,2019-3-1
5、66,1.,信息技術支持,2.,協(xié)同翻譯模式,3.,標準項目管理,4.,市場需求導向,文本處理、,機器翻譯,、翻譯記憶、術語庫、語料庫,、百科全書、在線詞典、,搜索引擎,、專業(yè)資料等,協(xié)同翻譯、角色分工、資源共享,角色分工、行業(yè)標準,關注市場需求、,實用文體、專業(yè)翻譯,我們的教學與現(xiàn)實的差距,?,2019-3-16,7,1.信息技術支持文本處理、機器翻譯、翻譯記憶、術語庫、語料庫,HT,Human Translation,CAT,Computer-aided Translation,MT,Machine Translation,2019-3-16,幾個術語,8,HT Human Transla
6、tion2019-3-1,IT:,自動化程度劃分,人機結合,各得其所,Hutchins&Somers,1992,參見短片:認識不同的翻譯軟件,什么是,CAT,9,IT:自動化程度劃分人機結合,各得其所Hutchins&,參見 馮志偉,機器翻譯研究,2004.,中國對外翻譯出版公司,制造一種機器,讓使用不同語言的人無障礙地自由交流,一直是人類的一個夢想。,MT,早于計算機,(1629,笛卡爾,),機器翻譯的研究始于上世紀四十年代。,機器翻譯,(,Machine Translation,),:利用計算機及其軟件把一種語言,(,自動,),翻譯成為另外一種語言的技術。,MT:,發(fā)展歷程,參見 馮志偉機
7、器翻譯研究2004.中國對外翻譯出版公司M,MT:,發(fā)展歷程,1933-1954,初創(chuàng)階段,1949,年,,Warre,n,Weave,r,提倡,M,T,研究,翻譯的過程可用解密過程,(,decoding),來類比,1954-1966,發(fā)展階段,Georgetown+IBM,第一個俄英翻譯實驗,1966-1976,低潮(,難以跨越的,“,語義障礙,”,(,semantic barrier),,,機器翻譯很困難,這個結論來之不易,),ALPAC,(,自動語言處理顧問委員會,,Automatic Language Processing Advisory Committee),報告,1976-,復蘇
8、,11,MT:發(fā)展歷程11,機器翻譯研究的發(fā)展歷程,70,年代,機器翻譯研究開始復蘇,TAUM-METEO,系統(tǒng)獲得成功,歐共體啟用,SYSTRAN,系統(tǒng),人工智能、知識工程進展的影響。,80,年代,機器翻譯研究呈繁榮局面,,,系統(tǒng)產(chǎn)品出現(xiàn),日本實施五國合作的,ODA,計劃,歐盟實施,Eurotr,a,計劃,多個公司推出了,M,T,產(chǎn)品,機器翻譯方法的進展,90,年代,,平臺,.,難以提高,新方法出現(xiàn),1999.,統(tǒng)計,MT,突破,機器翻譯方法的多樣化,2019-3-16,12,機器翻譯研究的發(fā)展歷程70年代,機器翻譯研究開始復蘇2019,機器翻譯的理論基礎或類型,:Rule/Statisti
9、cs,Whenever I,fire a linguist,our system performance improves,1988,Some of my Best Friends are Linguists.,2004,Frederick Jelinek,Julian Sinclair Smith Professor,Department of Electrical and Computer EngineeringJohns Hopkins University,Yorick Wilks,Professor of Artificial IntelligeceDepartment of Com
10、puter ScienceUniversity of Sheffield,Stone soup,2019-3-16,13,機器翻譯的理論基礎或類型:Rule/StatisticsW,MT,是語言學問題,詞序,I have enjoyed hearing about your experience in Africa.,多義詞,spririt,介詞,The fish was bought by the cook/river.,連詞,and,問題,It is necessary to study the history and grammar of Chinese language.,參見劉涌泉,
11、1997,2019-3-16,I saw a girl with a telescope in the bank.,14,MT是語言學問題詞序參見劉涌泉 19972019-3-16I,理性主義的規(guī)則,-,智能法,直接轉(zhuǎn)換,transfer,中間語言,interlingua,經(jīng)驗主義的語料統(tǒng)計法,統(tǒng)計機器翻譯,statistical MT,基于實例的機器翻譯,Example-based MT,詞典,+,規(guī)則,語料,+,統(tǒng)計,Give me enough parallel data,and you can have translation system for any two languages
12、in a matter of hours.,Franz Joseph Och,Stone soup,“,統(tǒng)計,+,規(guī)則,”,英漢機器翻譯測試大綱,(,俞士汶,),2019-3-16,機器翻譯的基本,類型,15,理性主義的規(guī)則-智能法詞典+規(guī)則語料+統(tǒng)計Give me e,基于實例的機器翻譯,Exampl,e,Base,d,Machin,e,Translation(EBMT),1984,年由日本著名機器翻譯專家長尾真提出,背景,建立在轉(zhuǎn)換基礎上的機器翻譯系統(tǒng),在差異較大語言對間進行互譯時,效果不好,人在翻譯時不做深層次語言學分析,人在學外語的時候,首先要作大量的對照記憶,在遇到新的句子時,會和記
13、憶中的句子類比,建立基于類比思想的機器翻譯,2019-3-16,16,基于實例的機器翻譯Example Based Machine,基于實例的機器翻譯,基本思想,主要知識庫是雙語對照的實例庫,當需要翻譯一個新句 子時,通過檢索的辦法在實例庫中尋找和該句類似的翻譯實例。,新句子的翻譯可通過模擬最類似的實例的譯文的方式獲得。,2019-3-16,17,基于實例的機器翻譯基本思想2019-3-1617,基于實例的機器翻譯,EBM,T,的優(yōu)點,系統(tǒng)維護容易,*,系統(tǒng)中知識以翻譯實例和義類詞典等形式存在,可以很容 易的利用增加實例和詞匯的方式擴充系統(tǒng)。,容易產(chǎn)生高質(zhì)量的譯文,*,尤其是利用了較大的翻譯實
14、例或和實例精確匹配時更是如 此。,可避免進行深層次的語言學分析,2019-3-16,18,基于實例的機器翻譯EBMT的優(yōu)點2019-3-1618,基于實例的機器翻譯,EBMT,的關鍵問題,大規(guī)模的雙語語料庫,雙語對齊問題,*,語篇、句子、短語和詞匯等各種級別,建立合理的相似度準則,高效的實例檢索機制,譯文生成,翻譯記憶技術和基于模板的翻譯技術,2019-3-16,19,基于實例的機器翻譯EBMT的關鍵問題2019-3-1619,基于統(tǒng)計的機器翻譯,Statistic-Base,d,Machin,e,Translation(SBMT),5,0,年代初曾有提及,遭到以,Chomsky,為代表的語言
15、學家的反對,9,0,年代初,統(tǒng)計翻譯技術復蘇,統(tǒng)計技術在語音識別領域獲得成功,目前計算機性能已能勝任密集型計算,目前也有大量聯(lián)機雙語電子文本,2019-3-16,20,基于統(tǒng)計的機器翻譯Statistic-Based Machi,不能完全指望機器翻譯,詞典,詞庫廣泛性:收錄夠不夠,詞條描寫性:框架合適不合適,詞典適應性:加載不同屬性詞典,規(guī)則,規(guī)則廣度與精度,規(guī)則沖突的解決,數(shù)據(jù),是否有足夠多的語料,是否有較好的算法,Will you,marry,me,新造詞是否有對應譯法,?,不折騰,嫁給我,/,娶我,mouse,21,不能完全指望機器翻譯詞典Will you marry me新,關于,CA
16、T,全自動高質(zhì)量翻譯,FAHQT,不行,,CAT,呢,計算機輔助翻譯的主體是誰?,計算機輔助翻譯的主體是人。相對比較容易,很實用。,人機結合,各得其所,機器儲存、記憶能力,人工智能,核心:翻譯記憶,(,相似性的評判標準,),適用于規(guī)范、重復性高的文本,.,Eg.Office 2003,Office 2007 Documents,盡可能大而全的語料、盡可能好而快的算法,.,22,關于CAT全自動高質(zhì)量翻譯FAHQT不行,CAT呢22,狹義與廣義,翻譯技術,翻譯技術體現(xiàn)為一組翻譯工具,是若干軟件工具的集合。,計算機輔助翻譯(,CAT,)關注的是“如何應用計算機軟件,最大限度地實現(xiàn),翻譯流程的自動化,,提高人工翻譯的,效率,,保證人工翻譯的,質(zhì)量,,并能夠,管理翻譯流程,”,狹義與廣義翻譯技術翻譯技術體現(xiàn)為一組翻譯工具,是若干軟件工具,CAT,,范圍較廣,凡是有助于翻譯的,IT,工具,上傳下載,:Email,/FTP/Portal,虛擬系統(tǒng):登陸客戶方系統(tǒng)翻譯,殺毒防毒,:kaspersky,360;,網(wǎng)絡收藏夾:資源分類和整理,即時交流,:MSN,Skype,、,QQ,系統(tǒng)管理,:,分割、