一種實(shí)體關(guān)聯(lián)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
2023-04-07
一種實(shí)體關(guān)聯(lián)方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括:獲取待處理文本的特征向量;根據(jù)待處理文本中實(shí)體之間的關(guān)系構(gòu)造實(shí)體對(duì);針對(duì)每一個(gè)實(shí)體對(duì)在知識(shí)圖譜中獲取非泛化關(guān)系路徑的特征向量與待處理文本的特征向量的最大相似度,作為實(shí)體對(duì)與待處理文本的第一相似度;針對(duì)待處理文本中每一個(gè)實(shí)體在知識(shí)圖譜中獲取關(guān)系路徑的特征向量與待處理文本的特征向量的最大相似度,作為實(shí)體與待處理文本的第二相似度;根據(jù)包含待處理文本中實(shí)體的實(shí)體對(duì)對(duì)應(yīng)的第一相似度和實(shí)體對(duì)應(yīng)的第二相似度獲取實(shí)體與知識(shí)圖譜的關(guān)聯(lián)得分;當(dāng)關(guān)聯(lián)得分超過(guò)預(yù)設(shè)閾值,將實(shí)體關(guān)聯(lián)到第二相似度對(duì)應(yīng)的知識(shí)圖譜節(jié)點(diǎn)上。由于利用了多實(shí)體之間的關(guān)系,因此提高了實(shí)體的關(guān)聯(lián)成功率。
一種實(shí)體關(guān)聯(lián)方法,其特征在于,包括:獲取待處理文本的特征向量;其中,所述待處理文本中包含若干個(gè)待關(guān)聯(lián)至知識(shí)圖譜中節(jié)點(diǎn)的實(shí)體;根據(jù)所述待處理文本中實(shí)體之間的關(guān)系構(gòu)造若干個(gè)實(shí)體對(duì);針對(duì)每一個(gè)實(shí)體對(duì)在知識(shí)圖譜中獲取非泛化關(guān)系路徑的特征向量與所述待處理文本的特征向量的最大相似度,作為所述實(shí)體對(duì)與所述待處理文本的第一相似度;其中,當(dāng)所述實(shí)體對(duì)之間不存在非泛化關(guān)系路徑,所述第一相似度為0;針對(duì)所述待處理文本中每一個(gè)實(shí)體在所述知識(shí)圖譜中獲取關(guān)系路徑的特征向量與所述待處理文本的特征向量的最大相似度,作為所述實(shí)體與所述待處理文本的第二相似度;根據(jù)包含所述待處理文本中實(shí)體的實(shí)體對(duì)對(duì)應(yīng)的第一相似度和所述實(shí)體對(duì)應(yīng)的第二相似度獲取所述實(shí)體與所述知識(shí)圖譜的關(guān)聯(lián)得分;當(dāng)關(guān)聯(lián)得分超過(guò)預(yù)設(shè)閾值,將所述實(shí)體關(guān)聯(lián)到所述第二相似度對(duì)應(yīng)的知識(shí)圖譜中的節(jié)點(diǎn)上。
申請(qǐng)?zhí)枺篊N201911378790.6
申請(qǐng)(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開(kāi)日期(公開(kāi)):2020.05.15
公開(kāi)日期(授權(quán)):2023.04.07
信息填寫(xiě)