今天騰訊混元宣布正式開源翻譯模型1.5版本,騰訊共包含兩個模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B。混元
目前,開源兩個模型均已在騰訊混元官網上線,翻譯在Github和Huggingface等開源社區也可直接下載使用。模型

據了解,手機該版本支持33個語種互譯以及5種民漢/方言,效果除中文、超商英語、騰訊日語等常見語種,混元也包含捷克語、開源馬拉地語、翻譯愛沙尼亞語、模型冰島語等小語種。手機
其中,效果HY-MT1.5-1.8B主要麵向手機等消費級設備場景,經過量化,支持端側直接部署和離線實時翻譯,僅需1GB內存即可流暢運行,並且在參數量極小的前提下,效果超過了大部分商用翻譯API。
同時,模型也體現出了極致的效率和性價比,與主流商用翻譯模型API對比,HY-MT1.5-1.8B 推理速度更快,處理50個tokens的平均耗時隻有0.18秒,其他模型的時間在0.4秒左右。
以下為混元Tencent-HY-MT1.5-1.8B與蘋果iphoness自帶離線翻譯的結果對比:

HY-MT1.5-7B模型效果相比前一版本效果有較大提升,是此前獲得WMT25比賽30個語種翻譯冠軍模型的升級版,重點提升了翻譯準確率,大幅減少了譯文中夾帶注釋和語種混雜的情況,實用性進一步增加。
官方表示,在部分用戶實際使用場景下,混元翻譯1.8B和7B兩個尺寸模型同時使用,可以實現端側和雲側模型的協同部署,提升模型的效果的一致性和穩定性。
