ERNIE模型的MASK的策略和BERT的區別 例如:哈利波特是 J.K.羅琳寫的小說。單獨預測哈[MASK]波特或者 J.K.[MASK]琳情況下,模型無法學到哈利波特和 J.K.羅琳的關系。如果把哈利波特直接 MASK 掉的話,那模型可以根據作者,就預測到小說這個實體,實現知識的學習。 行業數據 下載Excel 下載圖片 原圖定位