heteronym=1对长词十分不友好,因为其很容易导致笛卡尔积爆炸。 如果允许导入输入法词库,则可以使用输入法的无调拼音用于过滤多音字,极大降低笛卡尔积数。 导入源使用输入法是因为CC-CEDICT的覆盖面相对来说并不够全。
heteronym=1对长词十分不友好,因为其很容易导致笛卡尔积爆炸。
如果允许导入输入法词库,则可以使用输入法的无调拼音用于过滤多音字,极大降低笛卡尔积数。
导入源使用输入法是因为CC-CEDICT的覆盖面相对来说并不够全。