引用:
作者blackleo
有點問題
有些繁體字
會被錯字
目前看到的是
如主機板的板
會變老闆的闆
|
我前面就講有錯字
將就用,不然就是去代碼裡找出對應字自己修改掉乾脆不要轉換就可以(我都這樣)
Meihua Chinese Converter 作者也說簡轉繁一定都會有錯字
以前新同文也是有錯字,只是你沒注意到
腳本包含字庫更少.....有些轉換也無法做細部判別
修改字庫加字也會拖慢轉換速度,像前面twu2修改版就講到
引用:
目前轉換演算法的侷限
(非語意分析的人工智慧)字典映射轉換的演算法有著侷限。舉例來說,單字轉換收錄了 [里->裡] ,詞庫就必須收錄由「里」構成的詞組來避免過度轉換,比如: [里拉->里拉](里拉是土耳其的貨幣單位),但這又會造成「把他从沙子里拉出来」這句子的錯誤轉換,且不論「容器類名詞+裡」的詞組(沙子裡、房間裡)的數量有多少,就算都收錄了,那試看這一句「把宅男从网购里拉出来」,名詞或動詞名詞化的詞組又有多少呢?何況這樣的例子俯拾皆是「部落发生什么事了」(落髮)、「克拉克死了」(剋死)。簡繁轉換問題的根本解決之道在於翻過語義識別這座高山。
|