拉尾盘说明什么-股票app官网公司名称-【东方资本】,股票交易规则t 0代表什么,a股怎样会被st,涨8配资网站

EN

超AI說(shuō)|組織內(nèi)海量信息共享難,檢索快準(zhǔn)狠,獲取知識(shí)更容易組織內(nèi)海量信息共享難

2021-10-26

信息檢索系統(tǒng),其實(shí)在我們的生活和工作當(dāng)中,已經(jīng)有了很多大家可以實(shí)際感知的應(yīng)用。比如說(shuō),在生活當(dāng)中大家會(huì)通過(guò)搜索引擎去搜索自己想要的信息,這些都是通過(guò)主動(dòng)搜索行為去使用的。在工作當(dāng)中,大家也會(huì)去通過(guò)搜索的方式去檢索公司里面沉淀下來(lái)這些知識(shí)、文檔、學(xué)習(xí)資料。還有就是,今天越來(lái)越多的商業(yè)情報(bào)或者是政府新聞,也越來(lái)越多地開(kāi)放在互聯(lián)網(wǎng)上面,大家會(huì)通過(guò)搜索商業(yè)情報(bào)去獲取合作伙伴或項(xiàng)目的背景知識(shí)。這些其實(shí)都是我們現(xiàn)實(shí)當(dāng)中每天正在發(fā)生的。

信息檢索技術(shù)不管是在過(guò)去還是未來(lái),它的研究重點(diǎn)都是在三個(gè)方面:快、準(zhǔn)、狠。那么我們通常是通過(guò)什么樣的技術(shù)手段去解決呢?

“快”這個(gè)方面,我們實(shí)際上是要更快地把結(jié)果反饋給用戶,那就需要通過(guò)專業(yè)上叫做“索引結(jié)構(gòu)”來(lái)解決。大家可以想象,以前查字典的時(shí)候,都是需要通過(guò)拼音或者部首偏旁,在字典里快速地定位這個(gè)字。針對(duì)不同的檢索的目標(biāo),網(wǎng)頁(yè)也好、文檔也好,其實(shí)都是需要用計(jì)算機(jī)的算法技術(shù)建立起一套好的索引結(jié)構(gòu),使其能夠很好地支撐上層的檢索。

“準(zhǔn)”是說(shuō),當(dāng)我們有了一系列候選的目標(biāo)文檔或者目標(biāo)建筑之后,怎么樣能夠知道這些目標(biāo)中,有哪一些是符合我們用戶的需求?其實(shí)這是一個(gè)排序的問(wèn)題。

“狠”更關(guān)注的是,我們?cè)趺礃幽馨迅脩羲阉飨嚓P(guān)的目標(biāo)全部檢索出來(lái)。相關(guān)其實(shí)包括很多方面,有可能是時(shí)下的熱點(diǎn),也有可能是用戶搜索這個(gè)關(guān)鍵詞的語(yǔ)義延伸,也有可能是他所在位置附近的候選目標(biāo)。所以有很多維度都相關(guān),怎么樣能把這些相關(guān)的東西全部搜索出來(lái)不漏掉,這個(gè)是很關(guān)鍵的。

信息檢索這個(gè)領(lǐng)域的國(guó)際主流研究方向會(huì)在以下幾個(gè)方面:

  1. 怎么樣使用海量的用戶使用行為,去做越來(lái)越精確的機(jī)器學(xué)習(xí)模型;
  2. 多模態(tài),比如檢索系統(tǒng)里面有文字、圖像,也有語(yǔ)音的時(shí)候,怎樣把它們結(jié)合起來(lái)去做檢索;
  3. 專業(yè)領(lǐng)域的檢索,比如說(shuō)社交網(wǎng)絡(luò)或地理信息系統(tǒng)。

這些研究方向在國(guó)內(nèi)的落地瓶頸其實(shí)在于,我們?cè)趺礃影鸦ヂ?lián)網(wǎng)產(chǎn)業(yè)的信息檢索研究成果,應(yīng)用到我們實(shí)際上服務(wù)的各行各業(yè):

  1. 比如,每個(gè)專業(yè)有自己的表格、公式、術(shù)語(yǔ),這些東西我們?cè)趺慈ヌ幚恚?/li>
  2. 另外,我們?cè)趺礃犹幚碛脩粼絹?lái)越多的問(wèn)答式交互的提問(wèn)?
  3. 最后,沒(méi)有這么多的用戶使用行為的時(shí)候,我們?cè)趺礃幼鼍_排序的模型?怎么用知識(shí)增強(qiáng)的方式彌補(bǔ)我們?nèi)鄙俚挠脩羰褂眯袨椋?/li>

針對(duì)剛才講的三個(gè)問(wèn)題,明略科技其實(shí)在服務(wù)產(chǎn)業(yè)互聯(lián)網(wǎng)的過(guò)程當(dāng)中已經(jīng)積累了不少的經(jīng)驗(yàn)。

比如針對(duì)這個(gè)專業(yè)領(lǐng)域的數(shù)字、表格、公式、專業(yè)的名詞,我們已經(jīng)能夠很快地針對(duì)數(shù)字類的、統(tǒng)計(jì)類的檢索場(chǎng)景做優(yōu)化,并且我們可以很快積累專業(yè)領(lǐng)域的實(shí)體識(shí)別。

另外,如果我們沒(méi)有這么多的用戶使用行為,我們?cè)趺礃咏ㄔO(shè)精確的排序模型,返回給用戶最精確的知識(shí)、最精確的檢索結(jié)果?我們是通過(guò)我們強(qiáng)大的知識(shí)圖譜建設(shè)能力,相當(dāng)于我們?cè)跈z索引擎背后有一張知識(shí)的網(wǎng)絡(luò),可以在用戶的每一個(gè)搜索詞后面,知道它的語(yǔ)義涵蓋的所有相關(guān)的信息。

最后一點(diǎn)跟國(guó)際上的主流有交匯的地方,就是現(xiàn)在越來(lái)越多的這個(gè)檢索引擎支撐問(wèn)答類的檢索方式,底層其實(shí)都是自然語(yǔ)言處理的技術(shù)。明略科技有很強(qiáng)大的自然語(yǔ)言處理團(tuán)隊(duì),能夠把最前沿的預(yù)訓(xùn)練模型以及閱讀理解模型,運(yùn)用到問(wèn)答式的檢索場(chǎng)景。

這是我認(rèn)為明略科技在信息檢索領(lǐng)域三個(gè)最大的特色。

信息填寫(xiě)

*手機(jī)號(hào)碼:

請(qǐng)選協(xié)議