一種基于在線會話標(biāo)注的模型訓(xùn)練方法及裝置
2021-12-28
本申請?zhí)峁┝艘环N基于在線會話標(biāo)注的模型訓(xùn)練方法及裝置,獲取目標(biāo)通信應(yīng)用在線會話中的當(dāng)前的會話消息;獲取當(dāng)前的會話消息中包括關(guān)鍵提取內(nèi)容的目標(biāo)會話消息;根據(jù)關(guān)鍵提取內(nèi)容的定義對目標(biāo)會話消息添加第一標(biāo)識;根據(jù)初始的會話標(biāo)注模型,得到被標(biāo)識有第二標(biāo)識的當(dāng)前的會話消息;根據(jù)使用標(biāo)識有第一標(biāo)識的目標(biāo)會話消息與標(biāo)識有第二標(biāo)識的會話消息進(jìn)行一致性比對的結(jié)果,篩選出用于迭代訓(xùn)練初始的會話標(biāo)注模型的正負(fù)訓(xùn)練樣本并進(jìn)行訓(xùn)練,得到最終的會話標(biāo)注模型。這樣,本申請通過識別在線會話消息的關(guān)鍵提取內(nèi)容進(jìn)行標(biāo)識標(biāo)注,并將標(biāo)注后的會話消息自動轉(zhuǎn)機器學(xué)習(xí)訓(xùn)練,從而可以訓(xùn)練得到準(zhǔn)確率較高的會話標(biāo)注模型以及縮短模型訓(xùn)練周期。
一種基于在線會話標(biāo)注的模型訓(xùn)練方法,其特征在于,所述模型訓(xùn)練方法包括:獲取目標(biāo)通信應(yīng)用在線會話中的當(dāng)前的會話消息;獲取所述當(dāng)前的會話消息中包括關(guān)鍵提取內(nèi)容的目標(biāo)會話消息;所述關(guān)鍵提取內(nèi)容表征包括含有預(yù)設(shè)關(guān)鍵詞、預(yù)設(shè)關(guān)鍵語句和預(yù)設(shè)符號中至少一個的內(nèi)容;根據(jù)所述關(guān)鍵提取內(nèi)容的定義對所述目標(biāo)會話消息進(jìn)行標(biāo)識,得到被標(biāo)識有第一標(biāo)識的目標(biāo)會話消息;將所述當(dāng)前的會話消息輸入初始的會話標(biāo)注模型,得到被標(biāo)識有第二標(biāo)識的會話消息;根據(jù)使用標(biāo)識有第一標(biāo)識的目標(biāo)會話消息與標(biāo)識有第二標(biāo)識的會話消息進(jìn)行一致性比對的結(jié)果,篩選出用于訓(xùn)練所述初始的會話標(biāo)注模型的正負(fù)訓(xùn)練樣本;所述一致性比對包括文本一致性比對和/或標(biāo)識一致性比對;使用所述正負(fù)訓(xùn)練樣本對所述初始的會話標(biāo)注模型進(jìn)行迭代訓(xùn)練,更新所述初始的會話標(biāo)注模型,以得到最終的會話標(biāo)注模型。
申請?zhí)枺篊N202110978287.5
申請(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.09.24
公開日期(授權(quán)):2021.12.28
信息填寫