中国十大正规炒股平台东方财富,杠杆炒股app骗局是真的吗,股票交易可以网上开户吗

首頁明略研究一種基于語義向量的文檔標(biāo)記方法、裝置及介質(zhì)

一種基于語義向量的文檔標(biāo)記方法、裝置及介質(zhì)

2021-11-02

本申請?zhí)峁┝艘环N基于語義向量的文檔標(biāo)記方法、裝置及介質(zhì)，該方法包括以下步驟：獲取第一文檔、多個(gè)第二文檔以及多個(gè)第二文檔向量；將第一文檔的內(nèi)容向量化，得到第一文檔向量；根據(jù)第一文檔向量和多個(gè)第二文檔向量，計(jì)算第一文檔和每個(gè)第二文檔的內(nèi)容相似度，第一次篩選出預(yù)設(shè)數(shù)量個(gè)內(nèi)容相似度最高的第二文檔；根據(jù)第一文檔和第一次篩選出的每個(gè)第二文檔的標(biāo)題相似度，第二次篩選出標(biāo)題相似度大于或等于第一預(yù)設(shè)值的第二文檔；根據(jù)第二次篩選出的第二文檔的類別標(biāo)簽，為所述的第一文檔標(biāo)記類別標(biāo)簽，通過內(nèi)容和標(biāo)題的雙重篩選，提高了找出的第二文檔的準(zhǔn)確度。

一種基于語義向量的文檔標(biāo)記方法，其特征在于，包括以下步驟：獲取第一文檔、多個(gè)第二文檔以及多個(gè)第二文檔向量；所述的第一文檔為企業(yè)新產(chǎn)生的文檔，所述的第二文檔為預(yù)先保存的用于記錄企業(yè)信息的文檔，所述的第二文檔向量為預(yù)先保存的由第二文檔的內(nèi)容向量化得到的文檔向量；將第一文檔的內(nèi)容向量化，得到第一文檔向量；根據(jù)第一文檔向量和多個(gè)第二文檔向量，計(jì)算第一文檔和每個(gè)第二文檔的內(nèi)容相似度；進(jìn)行第一次篩選，以選出預(yù)設(shè)數(shù)量個(gè)內(nèi)容相似度最高的第二文檔；根據(jù)第一文檔的標(biāo)題和所述第一次篩選出的第二文檔的標(biāo)題，計(jì)算第一文檔和第一次篩選出的每個(gè)第二文檔的標(biāo)題相似度；從第一次篩選出的第二文檔中，進(jìn)行第二次篩選，以選出標(biāo)題相似度大于或等于第一預(yù)設(shè)值的第二文檔；根據(jù)第二次篩選出的第二文檔的類別標(biāo)簽，為所述的第一文檔標(biāo)記類別標(biāo)簽。

申請?zhí)枺篊N202110588633.9
申請（專利權(quán)）人：北京明略軟件系統(tǒng)有限公司
公開日期（公開）：2021.08.13
公開日期（授權(quán)）：2021.11.02

推薦閱讀

「2024生成式營銷產(chǎn)學(xué)研討會」在復(fù)旦大學(xué)管理學(xué)院舉行

2024-05-13

5月10日，第8個(gè)中國品牌日之際， 2024生成式營銷產(chǎn)學(xué)研討會在復(fù)旦大學(xué)管理學(xué)院史帶樓舉行。

了解更多

一種詞向量的確定方法、裝置、存儲介質(zhì)和電子裝置

2024-04-19

本申請涉及一種詞向量的確定方法、裝置、存儲介質(zhì)和電子裝置，其中，該方法包括：獲取未登錄詞中包含的多個(gè)目標(biāo)字符和獲取每個(gè)目標(biāo)字符的字符向量，其中，未登錄詞為不包含在預(yù)設(shè)詞典中的詞；確定目標(biāo)字符在預(yù)設(shè)詞典中的構(gòu)詞關(guān)系，其中，構(gòu)詞關(guān)系為目標(biāo)字符與預(yù)設(shè)詞典中包含的已登錄詞之間的關(guān)系；根據(jù)構(gòu)詞關(guān)系和每個(gè)字符向量確定未登錄詞的詞向量。本申請解決了未登錄詞的詞向量生成的效率較低的技術(shù)問題。

了解更多

目標(biāo)詞向量的確定方法、裝置、存儲介質(zhì)和電子裝置

2024-04-19

本申請涉及一種目標(biāo)詞向量的確定方法、裝置、存儲介質(zhì)和電子裝置，其中，該方法包括：獲取目標(biāo)領(lǐng)域的目標(biāo)文本中包含的目標(biāo)未登錄詞、目標(biāo)未登錄詞中包含的多個(gè)目標(biāo)字符以及每個(gè)目標(biāo)字符的字符向量，已登錄詞為目標(biāo)領(lǐng)域內(nèi)詞向量已知的詞，未登錄詞為目標(biāo)領(lǐng)域內(nèi)詞向量未知的詞；確定目標(biāo)字符與領(lǐng)域文本之間的目標(biāo)關(guān)系，其中，領(lǐng)域文本為目標(biāo)領(lǐng)域內(nèi)的文本，領(lǐng)域文本包括目標(biāo)文本，領(lǐng)域文本中包括已登錄詞和未登錄詞，目標(biāo)關(guān)系用于指示目標(biāo)字符在已登錄詞和未登錄詞中出現(xiàn)的頻率；根據(jù)目標(biāo)關(guān)系和目標(biāo)字符的字符向量確定目標(biāo)文本中包含的目標(biāo)未登錄詞在目標(biāo)領(lǐng)域內(nèi)的目標(biāo)詞向量。

了解更多

上一篇：一種白皮書生成方法、裝置、設(shè)備及存儲介質(zhì)

下一篇：明略科技亮相騰訊數(shù)字生態(tài)大會合力加速“數(shù)實(shí)融合”

返回行業(yè)資訊

拉尾盘说明什么-股票app官网公司名称-【东方资本】,股票交易规则t 0代表什么,a股怎样会被st,涨8配资网站