2022年3月4日星期五

Google翻譯的bug

大家會唔會學新語言嘅時候令到原先識嘅語言難左recall?有冇諗過用咩方法可以解決或者減少呢個問題?

我學完阿拉伯文之後,法文德文冇乜溫,大概都睇得明,但要講嘅話係好難搵啲字出嚟,硬係諗到阿拉伯文。其實有時諗廣東話都只係諗到英文或者阿拉伯文。

依家學波斯文,好驚擾亂阿拉伯文。

*****我是分隔線*****

之前講過學不同語言有排擠現有語言的風險,想到問題在於腦中字詞資料庫橫向聯繫不強,因為學語言時明白意思就不會翻譯成別的語言。於是想到應該做多語言的生字表,增強不同語言詞彙之間的聯繫。

但不想自己寫,想找現成的。可是現成的多語言字典通常是幾個歐洲語言,網上找到的生字表要整合也很麻煩,想到用Google翻譯將網上找來的生字列表同時譯幾個語言再改正,發現Google試算表有翻譯功能,函數式是例如 =GOOGLETRANSLATE(A1, "en", "zh-tw"),於是可以自動生成多語言生字表,很方便,但當然會有錯。細看錯得很有趣,尤其是親戚叫法中不對應的詞:有些語言有分男女,有些沒有;中文有分長幼,其他沒有;翻譯就會出問題。

記得之前有批評Google翻譯性別歧視,其實反映語料庫(corpus)中常見的組合,是社會上用法如此。為何cousin是表弟?sister是姐姐?half-sister是同父異母的妹妹?耐人尋味。

【阿拉伯文零基礎班】
四月十二日起逢星期二20:15至21:45,共八堂$2200。內容是字母及簡單日常對答。
如果情況許可會在油麻地上課,如果不能就zoom,實體上課而有困難不能到的同學也可以zoom。
有興趣請電郵orioleami@gmail.com

沒有留言:

發佈留言