一種白皮書生成方法、裝置、設(shè)備及存儲介質(zhì)
2021-11-02
本申請?zhí)峁┝艘环N白皮書生成方法、裝置、設(shè)備及存儲介質(zhì),其中,該方法包括:將目標(biāo)文本作為關(guān)鍵詞抽取模型的輸入數(shù)據(jù),得到至少一個關(guān)鍵詞;將各關(guān)鍵詞作為話術(shù)生成模型的輸入數(shù)據(jù),得到至少一個話術(shù)模板;針對每個話術(shù)模板中的每個待填充位置,根據(jù)各歷史關(guān)鍵詞在該待填充位置處出現(xiàn)的詞頻,將在各關(guān)鍵詞中確定的第一關(guān)鍵詞填充至該待填充位置,以得到目標(biāo)話術(shù)文本;針對每個目標(biāo)話術(shù)文本包括的每個目標(biāo)字詞,根據(jù)歷史字詞在目標(biāo)白皮書模板的各段落主題下出現(xiàn)的頻率,將該目標(biāo)話術(shù)文本填充至與其匹配度最高的段落主題下,以得到目標(biāo)行業(yè)的白皮書;通過上述方法,有利于降低人工工作量和人工成本。
一種白皮書生成方法,其特征在于,包括:將獲取到的至少一個目標(biāo)文本作為關(guān)鍵詞抽取模型的輸入數(shù)據(jù),得到從各所述目標(biāo)文本中確定的至少一個關(guān)鍵詞,其中,所述目標(biāo)文本為用于描述目標(biāo)行業(yè)的文本,所述關(guān)鍵詞為所述目標(biāo)文本中出現(xiàn)的詞頻大于或者等于預(yù)設(shè)閾值的詞語;將關(guān)鍵詞組作為話術(shù)生成模型的輸入數(shù)據(jù),得到為所述關(guān)鍵詞組匹配的至少一個話術(shù)模板,其中,所述關(guān)鍵詞組包括各所述關(guān)鍵詞;針對每個話術(shù)模板中的每一個待填充位置,根據(jù)各歷史關(guān)鍵詞在該待填充位置處出現(xiàn)的詞頻,在所述關(guān)鍵詞組中確定第一關(guān)鍵詞,其中,與所述第一關(guān)鍵詞相同的歷史關(guān)鍵詞所對應(yīng)的第一詞頻大于或者等于與第二關(guān)鍵詞相同的歷史關(guān)鍵詞所對應(yīng)的第二詞頻,所述第二關(guān)鍵詞包括所述關(guān)鍵詞組中除所述第一關(guān)鍵詞之外的其他關(guān)鍵詞,各所述歷史關(guān)鍵詞包括在至少一個歷史白皮書中確定的關(guān)鍵詞,各所述歷史白皮書針對的行業(yè)領(lǐng)域與所述目標(biāo)行業(yè)所屬的行業(yè)領(lǐng)域相同;將所述第一關(guān)鍵詞填充至該待填充位置,以得到目標(biāo)話術(shù)文本;針對每一個目標(biāo)話術(shù)文本包括的每一個目標(biāo)字詞,根據(jù)與該目標(biāo)字詞相同的歷史字詞在目標(biāo)白皮書模板的各段落主題下出現(xiàn)的頻率,確定該目標(biāo)話術(shù)文本與各段落主題的匹配度,其中,所述目標(biāo)字詞是通過對該目標(biāo)話術(shù)文本進(jìn)行分詞處理得到的,所述歷史字詞是通過對至少一個歷史話術(shù)文本進(jìn)行分詞處理得到的,各所述歷史話術(shù)文本包括:在各所述歷史白皮書中位于各所述段落主題下的文本,所述目標(biāo)白皮書模板針對的行業(yè)領(lǐng)域與所述目標(biāo)行業(yè)所屬的行業(yè)領(lǐng)域相同;將該目標(biāo)話術(shù)文本填充至與其匹配度最高的段落主題下,以得到所述目標(biāo)行業(yè)的白皮書。
申請?zhí)枺篊N202110894357.9
申請(專利權(quán))人:北京明略軟件系統(tǒng)有限公司
公開日期(公開):2021.09.07
公開日期(授權(quán)):2021.11.02
信息填寫