知識(shí)組塊提取方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
2021-10-15
本發(fā)明公開了一種知識(shí)組塊提取方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。其中,方法包括獲取PPTX文檔中每頁(yè)幻燈片的文本信息;其中,所述文本信息包括幻燈片中文本框中的文字內(nèi)容、文本框的位置和文本框中字體大小;根據(jù)所述文本信息,確定每頁(yè)幻燈片的知識(shí)類別;基于所述知識(shí)類別,對(duì)每頁(yè)幻燈片進(jìn)行要素抽取,獲取每頁(yè)幻燈片的知識(shí)組塊。采用本發(fā)明提供的方案能利用PPTX文檔中的字體格式等信息提取文檔中的知識(shí)組塊,提取更準(zhǔn)確。
一種知識(shí)組塊提取方法,其特征在于,所述方法包括:獲取PPTX文檔中每頁(yè)幻燈片的文本信息;其中,所述文本信息包括幻燈片中文本框中的文字內(nèi)容、文本框的位置和文本框中字體大小;根據(jù)所述文本信息,確定每頁(yè)幻燈片的知識(shí)類別;基于所述知識(shí)類別,對(duì)每頁(yè)幻燈片進(jìn)行要素抽取,獲取每頁(yè)幻燈片的知識(shí)組塊。
申請(qǐng)?zhí)枺篊N202110859647.X
申請(qǐng)(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.08.24
公開日期(授權(quán)):2021.10.15
信息填寫