圖片來源:Unsplash
近幾年,機(jī)器學(xué)習(xí)技術(shù)的發(fā)展勢頭迅猛,無數(shù)的在線工具和應(yīng)用程序開始出現(xiàn)幫助人們解決一些繁瑣的事情,甚至是能夠幫助你學(xué)習(xí)好一門新的語言。
就在幾個月之前,微軟公司表示借助人工智能技術(shù)公司在將新聞從中文翻譯成英文的過程中,其翻譯水平已經(jīng)非常接近人類翻譯的水平,這是一個具有歷史意義的里程碑。而Google公司也帶來了其離線版的基于神經(jīng)科學(xué)的機(jī)器智能翻譯,借助該技術(shù)其Android和iOS版的谷歌翻譯用戶可以在沒有互聯(lián)網(wǎng)連接的環(huán)境下對59種語言進(jìn)行高質(zhì)量的翻譯。
但是盡管機(jī)器翻譯工具越來越強(qiáng)大,但是當(dāng)很多因素?fù)诫s進(jìn)來之后,單純依賴機(jī)器翻譯的想法可能會遇到不小的問題。比如一些過于技術(shù)性的主題內(nèi)容、不常見的詞匯語音組合、甚至是一些呆板的文件格式,這些因素或許會讓那些需要有特定翻譯需求的企業(yè)或個人更加青睞計算機(jī)輔助翻譯(computer-assisted translation,簡稱CAT)的方法來尋求更佳的翻譯效果。
在翻譯過程的許多階段,人們可能都不得不借助一些外部幫助,包括文檔的管理、將文本準(zhǔn)備成可供翻譯的格式、當(dāng)然還包括翻譯和校對材料。通常來說,公司都會有大量的文本片段,這些文本可能是單詞、短語或是一些段落,并且在之前都已經(jīng)經(jīng)過翻譯。因此,在新的翻譯過程中,不需要重新對這些文本進(jìn)行重新翻譯,翻譯內(nèi)存數(shù)據(jù)庫(translation memory database)只需要確保翻譯者處理新的文本就可以了。隨著時間的推移,這個數(shù)據(jù)庫會不斷進(jìn)行改進(jìn)和擴(kuò)展,使用的次數(shù)越多,未來的翻譯過程就會越來越自動化。
在很多種情況下,人們要么是對由機(jī)器翻譯的文檔質(zhì)量非常滿意,要么寧可花錢雇人來糾正機(jī)器翻譯的錯誤。
現(xiàn)在,大多數(shù)的翻譯機(jī)構(gòu)都采用了將人和機(jī)器混合組合使用的方式,并根據(jù)客戶的需求優(yōu)化翻譯流程、質(zhì)量和價格。但是,當(dāng)你把人、機(jī)器、處理流程這些因素都丟進(jìn)一個大爐子之后,帶給你的或許是一種更大的困惑。這就是為什么現(xiàn)在很多翻譯機(jī)構(gòu)都會使用一種集中式的系統(tǒng),將所有因素都集中到同一個翻譯流程中。
Smartcat是一家提供SaaS服務(wù)的公司,聚焦在將翻譯流程自動化的服務(wù)。Smartcat由來自俄羅斯的Abbyy公司開發(fā),Abbyy公司曾開發(fā)了一系列的知名的文檔管理工具以及文本識別工具,2016年,Smartcat從Abbyy公司完全獨(dú)立出來運(yùn)營。
近日,Smartcat宣布完成了700萬美元的A輪融資,本輪融資由Matrix Partners領(lǐng)投。
在Smartcat平臺上聚集了超過10個機(jī)器翻譯引擎,這些引擎包括Google Translate、Microsoft Translator、Amazon Translate、百度以及Yandex等。之所以需要這么多的翻譯引擎,是因?yàn)檫@些引擎都有各自的優(yōu)勢和特點(diǎn),比如有的翻譯引擎在特定的語言組合或主題領(lǐng)域更加精通。Smartcat借助這些引擎技術(shù)向一些機(jī)構(gòu)出售他們的服務(wù),這些機(jī)構(gòu)包括專業(yè)翻譯人士、校對和翻譯機(jī)構(gòu)等。另外,Smartcat還將翻譯項(xiàng)目的管理、語言學(xué)家的指派、供應(yīng)商的支付等進(jìn)行了自動化。同時作為集中式管理平臺,Smartcat還提供校對和翻譯之間的協(xié)作。
從很多方面來說,語言是一個全球化世界發(fā)展的最后邊界。這就是為什么會有如此多的投資會將目光投向幫助人們進(jìn)行跨國家、跨文化之間的交流。
如今,微軟公司已經(jīng)在其即時通訊工具Skype中引入了實(shí)時的多種語言的翻譯,這些語言包括了日語、西班牙語、漢語普通話、阿拉伯語、俄語等等,其實(shí)時語音翻譯完全借助一些人工智能技術(shù)如深度學(xué)習(xí)或是人工神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)。
此外,社交網(wǎng)站LinkedIn最近也增加了一個新功能,這個功能能夠幫助人們自動翻譯用戶信息流中的內(nèi)容,而此前Twitter和Facebook都提供了類似的功能。有消息透露,F(xiàn)acebook正在嘗試使用無監(jiān)督的機(jī)器學(xué)習(xí)的方法,在這種情況下,并沒有太多的現(xiàn)成的翻譯示例可供參考使用。
另外,像Unbabel公司,他們提供了借助人工手段來校正翻譯內(nèi)容的機(jī)器翻譯平臺,公司也從諸如微軟、Salesforce、三星等大公司那里獲得了2300萬美元的資金支持。
根據(jù)一些市場調(diào)研市場統(tǒng)計,全球翻譯服務(wù)市場的整體規(guī)模為450億美元,而其中機(jī)器翻譯所占的市場規(guī)模目前僅僅為3億美元,預(yù)計到2023年將達(dá)到10億美元。
Matrix Partners的合伙人Hardi Meybaum表示,Smartcat擁有一款非常獨(dú)特的產(chǎn)品,該產(chǎn)品能夠?qū)⒎g的過程完全自動化,并且只需要幾步的點(diǎn)擊就可以將內(nèi)容轉(zhuǎn)換成任何一種語言。另外,我們對Smartcat的網(wǎng)絡(luò)組合也非常感興趣,它能夠讓所有參與者都能夠更加高效和簡單的進(jìn)行協(xié)作和完成支付。
本文轉(zhuǎn)自微信公眾號“Power教育”。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。