當前位置:律師網大全 - 專利申請 - 翻譯神器:“滾動翻譯”的知識在哪裏?這個小玩意怎麽用?

翻譯神器:“滾動翻譯”的知識在哪裏?這個小玩意怎麽用?

餵?餵???こんにちは?

請問妳的朋友懂這些語言嗎?恐怕大部分人都得用翻譯工具才能全部看懂!

人們住在不同的地方,使用不同的語言。正是翻譯的出現,使得跨地域、跨語言的交流成為可能。為了方便交流,翻譯工具不斷升級,翻譯功能越來越強大,從逐字翻譯到網站、圖片甚至文檔翻譯。

因此,為了提供更智能、更貼心的翻譯服務,讓每個人都能與更廣闊的世界交流,華為EMUI相繼推出了語音翻譯、AR翻譯、全屏翻譯。這壹次,華為的長文翻譯黑科技——滾動翻譯也登場了!

全屏翻譯不夠,滾動翻譯萬裏挑壹。

是不是經常遇到這樣的情況:寫論文的時候外文參考文獻很大?出國旅遊,外語攻略傻眼嗎?想追到壹個國外熱點,卻發現根本看不懂新聞?

如果要翻譯多屏內容,需要反復做全屏翻譯。隨著內容長度的增加,操作的復雜度也會降低閱讀的連貫性。面對這樣的場景,全屏翻譯變得“力不從心”。這時候就需要滾動翻譯來幫忙了!

卷軸翻譯支持多種應用、十種語言、多屏內容的翻譯。使用小I語音密碼“幫我翻譯屏幕”或兩指按住屏幕,點擊“全屏翻譯>;卷軸翻譯”,就可以開始妳的“卷軸翻譯”之旅了!

接下來,我們來看看滾動翻譯是如何完成長文章翻譯的!

精彩流水線:文字→圖片→翻譯

當妳瀏覽壹篇長文章,需要翻譯時,系統會先進行截圖,形成原文的長截圖,然後對長截圖進行剪切、檢測、翻譯、排序、復制、拼接,最後以同樣的圖片和翻譯後的文字再次呈現給妳,這就是所謂的滾動翻譯。

在這壹系列步驟中,最關鍵的是如何對長截圖進行初步處理。那用什麽技術來處理呢?這裏不得不提壹下關鍵技術——OCR技術。

問題是,OCR在哪裏?

OCR,即光學字符識別,是指對字符進行檢查、檢測和識別,然後將其形狀轉換為計算機字符的過程。這裏的應用是對原始長文章形成的長截圖上的字符進行識別和提取,提供給後續的機器翻譯,即完成長源字符的提取過程。

在技術上,它是壹個檢測和識別的兩階段算法框架,涉及中文、英文、日文、韓文、俄文、西班牙文、法文、德文、意大利文和葡萄牙文的識別能力,並包括運行在NPU(神經網絡處理單元)中的多個深度模型。

OCR算法被調用後,首先對圖像進行增強,圖像適應理想狀態後,通過多線程同步運行深度模型和後處理操作,最後通過NLU(natural language understanding)對輸出的文本識別結果進行校正。

翻譯準確與否,取決於OCR識別的準確性;翻譯的快慢取決於OCR處理字符的速度。對經過OCR處理的文字進行機器翻譯,對圖片進行重新排序和拼接,最後將翻譯好的長文呈現給用戶。

這種創新方案可以將長篇文章中的文字轉化為圖片,然後轉化為翻譯,目前已經申請了專利保護。

每個字每個圖都要完整。

在滾動翻譯中,創新性地使用OCR文本行定位實現圖像智能分割拼接,巧妙避免了長截圖分割時文本或圖像被截斷的情況。

妳可能會有這樣的疑問,原文形成的長截圖不能直接翻譯嗎?為什麽壹定要做細分?

這是因為目前的圖片翻譯只支持單屏內容的翻譯,長截圖會自動縮放到和屏幕壹樣的高度進行翻譯,圖片會被壓縮,文字大小自然也會被壓縮,這就大大影響了翻譯結果的準確性。

為了有效提高翻譯的準確性,在翻譯之前,把長截圖剪成幾個短圖片。但是,如果只是簡單地按照屏幕高度來分割壹個長截圖,很可能會截斷壹行文字或者壹個插圖。

在滾動翻譯中,OCR技術可以檢測壹行文本或壹幅圖片的位置坐標。如果發現分割位置在壹行或壹幅圖片的中間,它將向上移動到行與行之間的空白位置進行分割。

按此規則處理的圖片寬度與屏幕相同,高度等於或略低於屏幕高度,每行文字、每張圖片都是完整的。這個方案巧妙實用,在快速的同時保證了大家的翻譯體驗。

目前華為手機EMUI10版本可以體驗!系統自動滾動形成長截圖進行翻譯,方便快捷,真正做到所見即譯,滾動全文。

  • 上一篇:液化氣單竈哪個牌子好
  • 下一篇:加盟餐廳有什麽註意事項?
  • copyright 2024律師網大全