一種中文字向量學習方法及裝置
2021-09-17
本申請提供了一種中文字向量學習方法及裝置,該方法包括:將中文詞語庫中的詞進行拆分,得到待學習漢字,并將所述待學習漢字存入漢字庫;根據所述中文詞語庫和漢字庫,統計每個待學習漢字在所述中文詞語庫中的構詞數,以及每個待學習漢字在每個詞中的使用頻次;針對每個待學習漢字,根據該待學習漢字對應的構詞數,計算該待學習漢字對應的反詞語頻率;根據所述每個待學習漢字在每個詞中的使用頻次和每個待學習漢字的反詞語頻率進行加權計算,得到每個待學習漢字的字向量。
一種中文字向量學習方法,其特征在于,包括:將中文詞語庫中的詞進行拆分,得到待學習漢字,并將所述待學習漢字存入漢字庫;根據所述中文詞語庫和漢字庫,統計每個待學習漢字在所述中文詞語庫中的構詞數,以及每個待學習漢字在每個詞中的使用頻次;針對每個待學習漢字,根據該待學習漢字對應的構詞數,計算該待學習漢字對應的反詞語頻率;根據所述每個待學習漢字在每個詞中的使用頻次、每個待學習漢字的反詞語頻率和每個詞對應的詞向量進行加權計算,得到每個待學習漢字的字向量。
申請號:CN202110645779.2
申請(專利權)人:北京明略軟件系統有限公司
公開日期(公開):2021.07.09
公開日期(授權):2021.09.17
信息填寫