廈門大學(xué)第四屆機器翻譯研討會評測系統(tǒng)描述.ppt
《廈門大學(xué)第四屆機器翻譯研討會評測系統(tǒng)描述.ppt》由會員分享,可在線閱讀,更多相關(guān)《廈門大學(xué)第四屆機器翻譯研討會評測系統(tǒng)描述.ppt(19頁珍藏版)》請在裝配圖網(wǎng)上搜索。
廈門大學(xué)第四屆機器翻譯研討會評測系統(tǒng)描述 陳毅東史曉東周昌樂 ydchen mandel dozero 廈門大學(xué)信息科學(xué)與技術(shù)學(xué)院智能科學(xué)與技術(shù)系2008年11月北京 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 概述 廈門大學(xué)參加了漢英新聞領(lǐng)域機器翻譯 開放 漢英新聞領(lǐng)域系統(tǒng)融合英漢新聞領(lǐng)域機器翻譯 受限 英漢科技領(lǐng)域機器翻譯 受限 使用的模型漢英機器翻譯 短語 短語 規(guī)則英漢機器翻譯 短語 規(guī)則 規(guī)則 使用的融合方法和系統(tǒng)融合評測中使用的相同 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 機器翻譯系統(tǒng)概要 1 統(tǒng)計翻譯系統(tǒng)短語模型對數(shù)線性模型融合特征 短語翻譯概率 正向 反向 詞匯化短語翻譯概率 正向 反向 語言模型 長度懲罰因子 短語懲罰因子單調(diào)解碼 動態(tài)規(guī)劃方法漢英機器翻譯評測中 我們的短語翻譯系統(tǒng)則結(jié)合了基于組塊的詞語調(diào)序模型 機器翻譯系統(tǒng)概要 2 規(guī)則翻譯系統(tǒng)基本模塊 詞法分析 句法分析 詞義消歧 譯文生成采用依存文法描述英語和漢語 文法由程序來描述詞典條目大約10萬結(jié)合了部分TM技術(shù)沒有專門針對這次評測進行調(diào)整 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 系統(tǒng)融合方法概要 1 早在1994年就有研究者研究多引擎翻譯系統(tǒng) 多引擎系統(tǒng)的研究可以粗略地分成兩類 簡單地在各系統(tǒng)的輸出中選出一個最佳的結(jié)果 從各系統(tǒng)的輸出中各選取最佳片段并構(gòu)成新的結(jié)果 由于融合粒度更細 第二類方法常常可以獲得更好的融合效果 第二類系統(tǒng)融合技術(shù)需要解決的兩個問題 必須從候選翻譯中抽取出與原文相對應(yīng)的翻譯片段 必須在這些可用的翻譯片段中篩選并組合成新的翻譯結(jié)果 系統(tǒng)融合方法概要 2 參考文獻ChenYu AndreasEisele ChristianFedermann EvaHasler MichaelJellinghaus andSilkeTheison 2007 Multi EngineMachineTranslaitonwithanOpen SourceDecoderforStatisticalMachineTranslaiton In ProceedingsoftheSecondWorkshoponStatisticalMachineTranslation Prague 193 196 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 評測數(shù)據(jù)與結(jié)果 1 使用的外部工具GIZA 工具包對雙語語料進行詞對齊 訓(xùn)練模式是15H53545使用SRI語言模型工具包來訓(xùn)練語言模型使用CRF 工具包來訓(xùn)練組塊分析器 漢英測評中 評測數(shù)據(jù)與結(jié)果 2 漢英新聞機器翻譯評測數(shù)據(jù)結(jié)果 評測數(shù)據(jù)與結(jié)果 3 漢英新聞系統(tǒng)融合評測根據(jù)諸系統(tǒng)在ssmt2007測試集上的成績僅挑選了前4名的系統(tǒng)參與融合采用的數(shù)據(jù)情況同漢英新聞機器翻譯評測結(jié)果constrast系統(tǒng)使用和漢英新聞機器翻譯評測相同的參數(shù) primary系統(tǒng)則將長度懲罰因子參數(shù)增加到原來的兩倍 評測數(shù)據(jù)與結(jié)果 4 英漢新聞機器翻譯評測數(shù)據(jù)情況結(jié)果 評測數(shù)據(jù)與結(jié)果 5 英漢科技機器翻譯評測數(shù)據(jù)情況結(jié)果xmu constrast memt2系統(tǒng)僅使用科技語料 提綱 概述機器翻譯系統(tǒng)概要系統(tǒng)融合方法概要測評數(shù)據(jù)與結(jié)果小結(jié) 小結(jié) 本次評測我們參加的系統(tǒng)在技術(shù)上沒有太多的進步 本次評測我們所使用的系統(tǒng)融合技術(shù)太簡陋 是將來努力的重點 謝謝大家 陳毅東史曉東 ydchen mandel- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 廈門大學(xué) 第四 機器翻譯 研討會 評測 系統(tǒng) 描述
鏈接地址:http://www.hcyjhs8.com/p-8732271.html