一種中文字向量學(xué)習(xí)方法及裝置
2021-09-17
本申請?zhí)峁┝艘环N中文字向量學(xué)習(xí)方法及裝置,該方法包括:將中文詞語庫中的詞進(jìn)行拆分,得到待學(xué)習(xí)漢字,并將所述待學(xué)習(xí)漢字存入漢字庫;根據(jù)所述中文詞語庫和漢字庫,統(tǒng)計(jì)每個待學(xué)習(xí)漢字在所述中文詞語庫中的構(gòu)詞數(shù),以及每個待學(xué)習(xí)漢字在每個詞中的使用頻次;針對每個待學(xué)習(xí)漢字,根據(jù)該待學(xué)習(xí)漢字對應(yīng)的構(gòu)詞數(shù),計(jì)算該待學(xué)習(xí)漢字對應(yīng)的反詞語頻率;根據(jù)所述每個待學(xué)習(xí)漢字在每個詞中的使用頻次和每個待學(xué)習(xí)漢字的反詞語頻率進(jìn)行加權(quán)計(jì)算,得到每個待學(xué)習(xí)漢字的字向量。
一種中文字向量學(xué)習(xí)方法,其特征在于,包括:將中文詞語庫中的詞進(jìn)行拆分,得到待學(xué)習(xí)漢字,并將所述待學(xué)習(xí)漢字存入漢字庫;根據(jù)所述中文詞語庫和漢字庫,統(tǒng)計(jì)每個待學(xué)習(xí)漢字在所述中文詞語庫中的構(gòu)詞數(shù),以及每個待學(xué)習(xí)漢字在每個詞中的使用頻次;針對每個待學(xué)習(xí)漢字,根據(jù)該待學(xué)習(xí)漢字對應(yīng)的構(gòu)詞數(shù),計(jì)算該待學(xué)習(xí)漢字對應(yīng)的反詞語頻率;根據(jù)所述每個待學(xué)習(xí)漢字在每個詞中的使用頻次、每個待學(xué)習(xí)漢字的反詞語頻率和每個詞對應(yīng)的詞向量進(jìn)行加權(quán)計(jì)算,得到每個待學(xué)習(xí)漢字的字向量。
申請?zhí)枺篊N202110645779.2
申請(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.07.09
公開日期(授權(quán)):2021.09.17
信息填寫