1
2
3
4
 關于我們
公司簡介
公司信息
組織結構
公司團隊
網站公告
翻譯資訊
常見問題
專業詞匯
行業規范
質量保證
合作流程
隱私保密
實習基地
人才招聘
聯系信息
  翻譯語種(筆譯)
  英語翻譯  德語翻譯
  日語翻譯  法語翻譯
  韓語翻譯  俄語翻譯
  英語口譯  德語口譯
  日語口譯  法語口譯
  韓語口譯  俄語口譯
  泰語翻譯  越南語翻譯
  意大利翻譯  西班牙翻譯
  葡萄牙翻譯  印度語翻譯
  馬來語翻譯  波斯語翻譯
  冰島語翻譯  老撾語翻譯
  丹麥語翻譯  瑞典語翻譯
  荷蘭語翻譯  藏族語翻譯
  挪威語翻譯  蒙古語翻譯
  拉丁語翻譯  捷克語翻譯
  緬甸語翻譯  印尼語翻譯
  希臘語翻譯  匈牙利語翻譯
  波蘭語翻譯   烏克蘭語翻譯
  芬蘭語翻譯  土耳其語翻譯
更多翻譯語種
     首頁 >>  關于我們>>  翻譯資訊
 


淺談機器翻譯的幾種方法

發布者:上海翻譯公司     發布時間:2019-5-20

  在計算機科學中,機器翻譯是人工智能的研究領域。
  機器翻譯( Machine Translation ) , 是使用電子計算機把一種自然語言(源語言, Source Language )翻譯成另外一種自然語言(目標語言, Target Language )的一種學科。
  這新學科同時也是一門新技術,它涉及到語言學,計算機科學,數學等許多部門,是非常典型的多邊緣交叉學科。
  人們一直在尋求更好的解決機器翻譯問題的方法,目前機器翻譯方法主要有基于規則的機器翻譯,基于語料庫的機器翻譯和混合式機器翻譯方法。


  一、基于規則的機器翻譯方法
  基于分析和轉換的機器翻譯方法
  人作翻譯時,把一個源語言句子譯成目標語言句子,設計到四個基本操作:目標語言單詞的檢索、調序、刪詞、增詞;機器翻譯系統的過程包括檢索、分析、轉換和生成主要四個階段,這被稱為基于分析和轉換的機器翻譯系統,也被認為是模擬人類翻譯活動最恰當的機制。
  該方法有三個階段,為分析—轉換—生成。一般情況下,分析以句法為主、語義為輔,正確的句法結構轉換加正確的詞匯譯文可以從源語言向目標語言傳遞完整的正確信息。以句法結構轉換附加一定的語義信息,?能夠構成轉換的基本層次[3]。標準機器翻譯系統中句子和短語層次的結構轉換是核心,產生式方式的轉換規則形式為:
  S是源語言的某個待翻譯單位(句子、短語等等),S1~Si是S中的下一級組成單位對于S,如果滿足條件<C1 C2···Ck>,則目標語言中有T1~Tj譯文構成了相應的等價物T。
  上述方法稱為基于句法的轉換方法,因為S1+S2+···Si一般來說就是源語言的的句法結構表示:也可以稱為直接轉換方法,因為對于每個源語言的翻譯組塊,都馬上給出一個目標語言組塊與之對應應該說,?這種轉換方法符合人的直覺認識也能夠實現。
  基于中間語言的機器翻譯方法
  基于中間語言的翻譯方法是對源語言進行分析以后產生一種稱為中間語言的表示形式,然后直接由這種中間語言的表示形式生成目標語言。所謂中間語言就是自然語言的計算機表示形式的系統化,它試圖創造出一種獨立于各種自然語言,同時又能表示各種自然語言的人工語言。
  基于中間語言的機器翻譯方法的優勢是無需一種語言到另一種語言的一一轉換,對于多語種的翻譯系統可以節約大量的轉換知識的手工獲取工作量,假如有N種語對需要相互翻譯,只要有2N個分析和生成??榫凸渙?。其中一半是源語言分析???,輸入為原文,輸出以1L表示:另一半是目標語言生成???,輸入為1L表示,輸出為目標語言譯文。然而,中間語言的機器翻譯方法也常遭到懷疑。因為是否能夠構造出表示各種不同的自然語言語法、語義的中間語言至少目前還是未知數。此外,中間語言能不能把各種語言的所有特征保留下來,又能很好生成對應的各種語言也是問題。所以,構造中間語言是一個巨大、復雜的工程,還包含許多理論研究,迄今為止的探索還沒有好的答案。
  基于轉換的方法采取了一系列轉換生成層次,各種分析多(如詞法、句法、語義和語境等),而且在分析的過程中,會出現許多歧義結構,顯然,如果沒有好的算法效率就會低;此外,對于那些不符合語法規則的句子,這種方法難于給出正確的翻譯結果。


  二、基于語料庫的機器翻譯方法
  基于統計的機器翻譯方法
  基于統計的機器翻譯方法,一般不要任何語言學知識,它的基本原理是實現源語言詞匯到目標語言詞匯的映射。其思路受到語音識別研究的啟發,因而應用了類似的方法來實現。研究者用大規模的雙語語料庫作為基礎,對源語言和目標語言詞匯的對應關系進行統計,根據統計規律輸出譯文。這種方法沒有使用語言知識,主要特征是概率基于統計的機器翻譯方法,一般不要任何語言學知識,它的基本原理是實現源語言詞匯到目標語言詞匯的映射。其思路受到語音識別研究的啟發,因而應用了類似的方法來實現。研究者用大規模的雙語語料庫作為基礎,對源語言和目標語言詞匯的對應關系進行統計,根據統計規律輸出譯文。這種方法沒有使用語言知識,主要特征是概率統計與隨機過程的方法成為了分析和生成過程的唯一方法。它的主要內容是雙語句對的對齊,通過詞匯同現的可能性來計算一種語言的一個詞映射到另一種語言的一個詞(或兩個、零個詞)的概率。應該說,基于統計的機器翻譯方法的出現改變了機器翻譯研究的面貌,從而開始了機器翻譯研究的新階段。
  統計方法最先在語音識別領域取得了成功,機器翻譯的噪聲通道模型可以視作最早的機器翻譯思想,其思路可以這樣理解:
  假設說話者已經用目標語想好了一句話T,但是說出的卻是源語言句子S。這樣一個過程可以看成為編碼過程。而統計的機器翻譯就是要從S回推T,可以看成解碼過程。這樣,統計的機器翻譯任務分為兩個部分:一是建模,即建立翻譯的計算方法以及從雙語語料庫中估計模型的參數;二是解碼,即尋求一種高效搜索算法取有關概率計算的最大值。
  基于統計的方法以大規模的雙語語料庫為基礎,需要訓練,一般翻譯速度比較慢;而且它還有被懷疑之處——這種方法會不會由于本身的固有屬性,不可能有很高的譯文正確率。但基于統計的機器翻譯方法還是具有很多優勢,如開發速度快、周期短、無需人工干預等,在特定領域訓練數據充分的情況下翻譯性能基本可以達到實用水平。
  基于實例的機器翻譯方法
  基于實例的機器翻譯方法通過結構化的翻譯例子直接把源語言的短語和句子與目標語言的短語和句子對應起來,方法的不同使得處理步驟或多或少,但都必須實現源語言到目標語言的轉換,其映射關系或者是詞到詞,或者是短語或句子到與之相應的等價物,或者是一棵句法樹到另一棵句法樹。
  基于實例的機器翻譯(EBMT)的實現過程簡單概述如下:給定源語言輸入句子S,在雙語語料庫C中匹配查找一個最相近的句子S’,則S’的譯文就被接受為S的譯文。翻譯的過程一般就是查找和復現相似的例子,發現和記起特定的源語言表達或相似的表達在以前是如何翻譯的,把以前的翻譯實例作為主要知識源。


  三、混合式機器翻譯方法
  基于混合式的機器翻譯方法能夠很好的利用兩種方法的優點,目前非常盛行?;旌鮮交鞣敕椒ㄊ墻詮嬖虻姆敕椒ê突諭臣頻姆敕椒ń岷?。在基于規則的技術中引入語料庫方法,其中有基于實例的方法、統計方法,通過對語料庫的預處理使其轉化為自然語言知識庫的方法。Rules post-processed by statistics統計方法做后處理,翻譯使用規則方法。Statistics guided by rules使用規則方法做前后處理,翻譯使用統計方法。
  混合式機器翻譯方法是效果最好的,但目前混合方法中各種模型的耦合方式還比較松散,進行多翻譯模型的深度融合可能是未來研究的一個熱點。
  機器翻譯瓶頸
  之前進行的機器翻譯的有益的探索中,凡是取得了結果的研究大都努力避開理解語言這一過程。因為這一過程本身涉及到了A的終極目標,機器的智能化。然而,這又是一個無法回避的問題,不能理解語言就不可能進行真正意義上的翻譯。

 

 
返 回
翻譯公司相關翻譯資訊信息:
我們還需要“翻譯腔”嗎?  

汪劍釗:詩歌就是那經受了翻譯考驗的東西  

致剛入門譯員的五點建議  

翻譯文學大量出現后,“翻譯腔”不可避免  

從《楊憲益翻譯研究》說起 譯者的擔當  

楊絳的“翻譯技巧”  

瑞科翻譯公司 - 德州扑克各种牌的概率
翻譯咨詢
點擊在線咨詢
瑞科上海翻譯公司
電話:021-63760188
021-63760109
電郵:[email protected]
地址:上海市中山南路969號谷泰濱江大廈12層
瑞科南京翻譯公司
電話:025-83602926
025-83602369
電郵:[email protected]
地址:南京市紅山路88號常發廣場3號樓825-829室
 南京翻譯公司 | 招聘英才 | 友情鏈接 | 服務區域 | 網站地圖 | 瑞科翻譯(新版)
瑞科翻譯公司專注翻譯16年,是一家專業的人工翻譯公司,潛心打造優質翻譯服務品牌!
©2004-2019 LocaTran Inc. All Rights Reserved.      版權歸瑞科(上海、南京)德州扑克各种牌的概率所有        滬ICP備09017879號-4