拉尾盘说明什么-股票app官网公司名称-【东方资本】,股票交易规则t 0代表什么,a股怎样会被st,涨8配资网站

EN

超AI說|組織內(nèi)海量信息共享難,檢索快準(zhǔn)狠,獲取知識更容易組織內(nèi)海量信息共享難

2021-10-26

信息檢索系統(tǒng),其實在我們的生活和工作當(dāng)中,已經(jīng)有了很多大家可以實際感知的應(yīng)用。比如說,在生活當(dāng)中大家會通過搜索引擎去搜索自己想要的信息,這些都是通過主動搜索行為去使用的。在工作當(dāng)中,大家也會去通過搜索的方式去檢索公司里面沉淀下來這些知識、文檔、學(xué)習(xí)資料。還有就是,今天越來越多的商業(yè)情報或者是政府新聞,也越來越多地開放在互聯(lián)網(wǎng)上面,大家會通過搜索商業(yè)情報去獲取合作伙伴或項目的背景知識。這些其實都是我們現(xiàn)實當(dāng)中每天正在發(fā)生的。

信息檢索技術(shù)不管是在過去還是未來,它的研究重點都是在三個方面:快、準(zhǔn)、狠。那么我們通常是通過什么樣的技術(shù)手段去解決呢?

“快”這個方面,我們實際上是要更快地把結(jié)果反饋給用戶,那就需要通過專業(yè)上叫做“索引結(jié)構(gòu)”來解決。大家可以想象,以前查字典的時候,都是需要通過拼音或者部首偏旁,在字典里快速地定位這個字。針對不同的檢索的目標(biāo),網(wǎng)頁也好、文檔也好,其實都是需要用計算機的算法技術(shù)建立起一套好的索引結(jié)構(gòu),使其能夠很好地支撐上層的檢索。

“準(zhǔn)”是說,當(dāng)我們有了一系列候選的目標(biāo)文檔或者目標(biāo)建筑之后,怎么樣能夠知道這些目標(biāo)中,有哪一些是符合我們用戶的需求?其實這是一個排序的問題。

“狠”更關(guān)注的是,我們怎么樣能把跟用戶搜索相關(guān)的目標(biāo)全部檢索出來。相關(guān)其實包括很多方面,有可能是時下的熱點,也有可能是用戶搜索這個關(guān)鍵詞的語義延伸,也有可能是他所在位置附近的候選目標(biāo)。所以有很多維度都相關(guān),怎么樣能把這些相關(guān)的東西全部搜索出來不漏掉,這個是很關(guān)鍵的。

信息檢索這個領(lǐng)域的國際主流研究方向會在以下幾個方面:

  1. 怎么樣使用海量的用戶使用行為,去做越來越精確的機器學(xué)習(xí)模型;
  2. 多模態(tài),比如檢索系統(tǒng)里面有文字、圖像,也有語音的時候,怎樣把它們結(jié)合起來去做檢索;
  3. 專業(yè)領(lǐng)域的檢索,比如說社交網(wǎng)絡(luò)或地理信息系統(tǒng)。

這些研究方向在國內(nèi)的落地瓶頸其實在于,我們怎么樣把互聯(lián)網(wǎng)產(chǎn)業(yè)的信息檢索研究成果,應(yīng)用到我們實際上服務(wù)的各行各業(yè):

  1. 比如,每個專業(yè)有自己的表格、公式、術(shù)語,這些東西我們怎么去處理?
  2. 另外,我們怎么樣處理用戶越來越多的問答式交互的提問?
  3. 最后,沒有這么多的用戶使用行為的時候,我們怎么樣做精確排序的模型?怎么用知識增強的方式彌補我們?nèi)鄙俚挠脩羰褂眯袨椋?/li>

針對剛才講的三個問題,明略科技其實在服務(wù)產(chǎn)業(yè)互聯(lián)網(wǎng)的過程當(dāng)中已經(jīng)積累了不少的經(jīng)驗。

比如針對這個專業(yè)領(lǐng)域的數(shù)字、表格、公式、專業(yè)的名詞,我們已經(jīng)能夠很快地針對數(shù)字類的、統(tǒng)計類的檢索場景做優(yōu)化,并且我們可以很快積累專業(yè)領(lǐng)域的實體識別。

另外,如果我們沒有這么多的用戶使用行為,我們怎么樣建設(shè)精確的排序模型,返回給用戶最精確的知識、最精確的檢索結(jié)果?我們是通過我們強大的知識圖譜建設(shè)能力,相當(dāng)于我們在檢索引擎背后有一張知識的網(wǎng)絡(luò),可以在用戶的每一個搜索詞后面,知道它的語義涵蓋的所有相關(guān)的信息。

最后一點跟國際上的主流有交匯的地方,就是現(xiàn)在越來越多的這個檢索引擎支撐問答類的檢索方式,底層其實都是自然語言處理的技術(shù)。明略科技有很強大的自然語言處理團(tuán)隊,能夠把最前沿的預(yù)訓(xùn)練模型以及閱讀理解模型,運用到問答式的檢索場景。

這是我認(rèn)為明略科技在信息檢索領(lǐng)域三個最大的特色。

信息填寫

*手機號碼:

請選協(xié)議