當前位置: 華文世界 > 科技

阿裏國際Marco轉譯大模型釋出:支持中英日韓西法等15種主流語言

2024-10-16科技

IT之家 10 月 16 日訊息,據阿裏國際 AI 團隊 AIDC-AI,阿裏國際最新研發的轉譯大模型 Marco 於今日正式上線,支持中、英、日、韓、西、法等 15 種全球主流語種。

官方稱其基於目前廣泛使用的開源評測數據集 Flores,Marco 轉譯大模型在 BLEU 自動評測指標上,領先於市面上的標桿轉譯產品,如 Google 轉譯、DeepL、GPT-4 等。

「你的寶貝正在路上」,不會再被轉譯成「Your baby is on the way」。以「尊嘟喜歡」這一網路用語為例,一些 AI 轉譯產品會將這句話轉譯為「Zundu likes it」, 而在 Marco 大模型中,這句話非常地道地轉譯為「I really like it」。

IT之家從官方獲悉,Marco 轉譯大模型透過面向多語言的數據篩選技術,如多語種混合語料甄別、多維度數據品質評估,獲得高品質、大規模的多語言數據,再結合多語言的混合專家、參數擴張方法,從而保證主導語言(如中、英)效能不下降的情況下,提升其他語種的品質。

對於個人使用者來說,Marco 能夠根據上下文提供高品質的轉譯和良好的可讀性,甚至支持不同的轉譯風格,滿足多樣化的轉譯需求。