?專利內(nèi)容由知識(shí)產(chǎn)權(quán)出版社提供
專利名稱:基于多源異構(gòu)數(shù)據(jù)的垂直領(lǐng)域知識(shí)圖譜構(gòu)建方法及
系統(tǒng)
專利類型:發(fā)明專利
發(fā)明人:李岱峰,李栩婷,林凱欣,古風(fēng)云,李鑫,廖健斌,江濤申請(qǐng)?zhí)枺篊N2021118118.1申請(qǐng)日:20211229公開號(hào):CN114254128A公開日:20220329
摘要:本發(fā)明公開了一種基于多源異構(gòu)數(shù)據(jù)的垂直領(lǐng)域知識(shí)圖譜構(gòu)建方法及系統(tǒng),方法包括S1:獲取構(gòu)建垂直領(lǐng)域知識(shí)圖譜需要的數(shù)據(jù)并進(jìn)行預(yù)處理;S2:構(gòu)建知識(shí)抽取任務(wù)模型;S3:利用強(qiáng)化學(xué)習(xí)對(duì)所述知識(shí)抽取任務(wù)模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的知識(shí)抽取任務(wù)模型;S4:利用訓(xùn)練好的知識(shí)抽取任務(wù)模型對(duì)步驟S1獲取的數(shù)據(jù)進(jìn)行知識(shí)抽取,得到三元組;S5:將所述三元組導(dǎo)入知識(shí)圖譜中,得到最終的知識(shí)圖譜。本發(fā)明解決了垂直領(lǐng)域多源數(shù)據(jù)處理困難、低效的問(wèn)題,提出一個(gè)可用于實(shí)現(xiàn)多種抽取任務(wù)的統(tǒng)一分層框架,將普遍的知識(shí)抽取任務(wù)建模為多個(gè)標(biāo)注子任務(wù),并基于框架進(jìn)行知識(shí)抽取,從而實(shí)現(xiàn)靈活的、可拓展的垂直領(lǐng)域知識(shí)圖譜構(gòu)建框架。
申請(qǐng)人:中山大學(xué)
地址:510275 廣東省廣州市海珠區(qū)新港西路135號(hào)
國(guó)籍:CN
代理機(jī)構(gòu):廣州粵高專利商標(biāo)代理有限公司
代理人:禹小明
更多信息請(qǐng)下載全文后查看