1. 知識圖譜的前世今生

        共 1772字,需瀏覽 4分鐘

         ·

        2021-01-26 17:02



        ??來自 | 知乎? ?作者 |?PMwei

        鏈接 | https://zhuanlan.zhihu.com/p/37057052
        編輯 | 深度學習這件小事
        本文僅做學術分享,如有侵權,請聯(lián)系后臺刪除。

        ? ?1 什么是知識圖譜?
        通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系網(wǎng)絡。
        知識圖譜這個網(wǎng)絡具備以下3種特性:
        1.1 由節(jié)點(Point)和邊(Edge)組成



        1.2 每個節(jié)點表示現(xiàn)實世界中存在的“實體”,每條邊為實體與實體之間的“關系”
        1.3 知識圖譜是關系的最有效的表示方式
        所以,知識圖譜本質(zhì)上就是語義網(wǎng)絡,是一種基于圖的數(shù)據(jù)結(jié)構(gòu);

        ?? 2 知識圖譜能干什么?
        先按知識圖譜應用的深度主要可以分為兩大類:
        一是通用知識圖譜,通俗講就是大眾版,沒有特別深的行業(yè)知識及專業(yè)內(nèi)容,一般是解決科普類、常識類等問題。
        二是行業(yè)知識圖譜,通俗講就是專業(yè)版,根據(jù)對某個行業(yè)或細分領域的深入研究而定制的版本,主要是解決當前行業(yè)或細分領域的專業(yè)問題。
        下面我根據(jù)這兩大類,分別從知識圖譜應用的廣度進行介紹:
        2.1 通用知識圖譜
        我們?nèi)粘R姷降亩际峭ㄓ弥R圖譜,主要應用于面向互聯(lián)網(wǎng)的搜索、推薦、問答等業(yè)務場景;
        先列舉3個通用知識圖譜的案例:
        2.1.1、百度知識圖譜(tupu.baidu.com/)
        2.1.2、搜狗搜索(sogou.com/)
        2.1.3、360搜索(so.com)
        2.2 行業(yè)知識圖譜
        行業(yè)知識圖譜指面向特定領域的知識圖譜,用戶目標對象需要考慮行業(yè)中各級別的人員,不同人員對應的操作和業(yè)務場景不同,因而需要一定的深度與完備性,行業(yè)知識圖譜對準確度要求非常高,通常用于輔助各種復雜的分析應用或決策支持,有嚴格與豐富的數(shù)據(jù)模式,行業(yè)知識圖譜中的實體通常屬性比較多且具有行業(yè)意義
        2.2.1、人脈路徑查詢
        基于兩個用戶之間的關聯(lián)實體(比如:所在單位、同事、同學、朋友、家人等)找到兩者之間的關聯(lián)路徑。
        2.2.2、企業(yè)社交圖譜查詢
        基于投資、任職、專利、招投標、涉訴關系以目標企業(yè)為核心心向外層層擴散,形成一個網(wǎng)絡關系圖,直觀立體展現(xiàn)企業(yè)關聯(lián)。
        2.2.3、企業(yè)最終控股人查詢
        基于股權投資關系尋找持股比例最大的股東,最終追溯至自然人或國有資源管理部門。
        2.2.4、輔助信貸審核
        基于知識圖譜數(shù)據(jù)的統(tǒng)一查詢,全面掌握客戶信息;避免由于系統(tǒng)、數(shù)據(jù)孤立、信息不一致造成信用重復使用、信息不完整等問題。
        2.2.5、反欺詐之組團騙貸
        同一個人利用多個身份去申請貸款,詳細見下圖:雖然貸款人A、貸款人B、貸款人C之間沒有直接的關系,但通過知識圖譜可以看出三者之間都共享某一部分信息,存在一定的組團騙貸風險。
        還有更多行業(yè)案例:
        1、企業(yè)發(fā)展歷程時序圖(融資)
        基于企業(yè)知識圖譜中的投融資事件發(fā)生的時間順序,記錄企業(yè)的融資發(fā)展歷程。
        2、競品分析
        電商平臺常會用到,兩家企業(yè)知識路徑越相似,競爭關系越緊張。
        3、征信系統(tǒng)
        根據(jù)用戶已有信息(例如:教育信息、身份信息、聯(lián)系方式、擔保或被擔保人信息)關聯(lián)多家平臺信用記錄。

        建設一個知識圖譜系統(tǒng),需要包括:知識建模、知識獲取、知識融合、知識存儲和知識應用5大部分:
        1、知識建模:構(gòu)建多層級知識體系,將抽象的知識、屬性、關聯(lián)聯(lián)關系等信息,進行定義、組織、管理,轉(zhuǎn)化成現(xiàn)實的數(shù)據(jù)庫。
        2、知識獲?。?/span>將不同來源、不同結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)化成圖譜數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)(解析)、知識標引、知識推理等,保障數(shù)據(jù)的有效性和完整性。
        3、知識融合:將多個來源、重復的知識信息進行融合,包括融合計算、融合計算引擎、手動操作融合等。
        4、知識存儲:根據(jù)業(yè)務場景提供合理的知識存儲方案,存儲方案具備靈活、多樣化、可拓展特性。
        5、知識應用:為已構(gòu)建知識圖譜提供圖譜檢索、知識計算、圖譜可視化等分析與應用能力。并提供各類知識計算的SDK,包含圖譜基礎應用類、圖結(jié)構(gòu)分析類、圖譜語義應用類、自然語言處理類、圖數(shù)據(jù)獲取類、圖譜統(tǒng)計類、數(shù)據(jù)集數(shù)據(jù)獲取類、數(shù)據(jù)集統(tǒng)計類。
        瀏覽 75
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
          
          

            1. 台湾一区二区 | 人人草网站 | 91九色蝌蚪91POR成人 | 香蕉免费在线视频 | 日韩精品少妇一二三区免费Av |