售前電話
135-3656-7657
售前電話 : 135-3656-7657
本文將會討論三個部分的內(nèi)容
1.醫(yī)療知識圖譜和通用知識圖譜的差別
2.醫(yī)療知識圖譜的兩個特征
3.醫(yī)療知識圖譜的幾個具體的應用場景
對知識圖譜的預測
hype cycle 2018預言了知識圖譜的上升。與此同時,許多企業(yè)也開始推出自己的知識圖譜服務。從通用的圖譜到金融領域反欺詐,各類的圖譜如同雨后春筍般地推出。
(2018 關(guān)注知識圖譜的上升)
但是,的預測,主要面向的是通用知識圖譜,而并非是某個領域知識圖譜的發(fā)展。尤其并不適用于醫(yī)療領域知識圖譜。
通用知識圖譜 vs醫(yī)療領域知識圖譜
醫(yī)療領域的知識圖譜( Graph, 下稱BMKG)和通用領域知識圖譜( Graph,GKB)之間的區(qū)別是非常大的。
通用領域知識圖譜的主要任務是發(fā)現(xiàn)大量不同類型的實體和關(guān)系,為各類通用服務提供知識的支持。因為可獲取的數(shù)據(jù)量大,因此各類深度學習方法,可以得以廣泛應用。因此可以認為是一類率先成熟的知識圖譜。
而生物醫(yī)療領域的知識圖譜,則是生命領域中,探索相對有限的類型的實體,及其之間的超級復雜的多樣化關(guān)系。BMKG的每個實體和關(guān)系,都是由實驗室實驗和臨床試驗的結(jié)果中抽取提煉而來。
(基于循證的知識圖譜)
相比起通用知識圖譜,醫(yī)療領域知識圖譜更加關(guān)注精確率。而這意味著,很多算法識別出來的實體和關(guān)系,離實用還有一定的距離。
舉例來說,和N2C2是醫(yī)療領域兩個著名的NLP競賽,前者側(cè)重于生物領域,后者關(guān)注臨床領域。從競賽歷史上提交的最佳任務結(jié)果來看,基本沒有實體和關(guān)系識別的F值達到90%以上的case。但是,在臨床和醫(yī)藥領域,很多時候?qū)鹊囊蟪^了99%。
在這里,我們得到了醫(yī)療知識圖譜的一個額外特征:以循證為基礎,對精度有要求。
國內(nèi)外知識圖譜的差異
北大的醫(yī)療知識圖譜,是國內(nèi)比較早公布出來的知識圖譜。
(:8002)
最近,OMAHA組織出品的HITA中,也包含了一個以“藥物-適應癥”為主的知識圖譜。它對外提供服務,可惜對普通用戶并不免費開放。
()
其他的醫(yī)療知識圖譜,雖然在網(wǎng)絡上能找到,卻鮮有公布出來可以使用的。
知識圖譜并非是一個全新的概念,從更學術(shù)的角度來說,它的本質(zhì)是 Web/ (語義網(wǎng)絡)。
NCBI(美國國家生物信息中心)是一個為整個生物醫(yī)療領域提供基礎數(shù)據(jù)的機構(gòu)。它出品的UMLS、MESH和OBA就是語義網(wǎng)絡產(chǎn)品。比如,UMLS包含了種135種實體,54種關(guān)系,是一個不折不扣的醫(yī)療知識圖譜。
在《》中,其中有大量的資源是由NCBI或者其下屬機構(gòu)提供的。
(UMLS的部分語義網(wǎng)絡關(guān)系圖)