1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        深淵之刃 | Greenplum數(shù)據(jù)庫之拉鏈表的實(shí)現(xiàn)

        共 4656字,需瀏覽 10分鐘

         ·

        2020-12-31 09:52

        點(diǎn)擊上方藍(lán)色字體,選擇“設(shè)為星標(biāo)”

        回復(fù)”資源“獲取更多驚喜

        大數(shù)據(jù)技術(shù)與架構(gòu)
        點(diǎn)擊右側(cè)關(guān)注,大數(shù)據(jù)開發(fā)領(lǐng)域最強(qiáng)公眾號!

        大數(shù)據(jù)真好玩
        點(diǎn)擊右側(cè)關(guān)注,大數(shù)據(jù)真好玩!

        歷史拉鏈表是一種數(shù)據(jù)模型,主要是針對數(shù)據(jù)倉庫設(shè)計(jì)中表存儲數(shù)據(jù)的方式而定義的;顧名思義,所謂歷史拉鏈表,就是記錄一個(gè)事務(wù)從開始一直到當(dāng)前狀態(tài)的所有變化的信息,拉鏈表可以避免按每一天存儲所有記錄造成的海量存儲問題,同事也是處理緩慢變化數(shù)據(jù)的一種常見方式。

        一、概念

        在拉鏈表中,每一條數(shù)據(jù)都有一個(gè)生效日期(sdate) 和 失效日期(edate)。假設(shè)在一個(gè)用戶表中,在 2019年10月8日 新增了兩個(gè)用戶,則這兩條記錄的生效時(shí)間為當(dāng)天,由于到 2019年10月8日 為止,這兩條記錄還沒有被修改過,所以失效時(shí)間為無窮大,這里設(shè)置為數(shù)據(jù)庫中的最大值(2999-12-31),如圖所示:

        第二天(2019-10-09),用戶 1001 被刪除,用戶 1002 的電話號碼被修改成 16500000006。為了保留歷史狀態(tài),用戶 1001 的失效時(shí)間被修改成 2019-10-09,用戶 1002 則變成兩條記錄,如圖所示:

        第三天(2019-10-10),又新增了用戶 1003,則用戶表數(shù)據(jù)如圖:

        如果要查詢最新的數(shù)據(jù),那么只要查詢失效時(shí)間為 2999-12-31 的數(shù)據(jù)即可,如果要查詢 10月8號 的歷史數(shù)據(jù),則篩選生效時(shí)間 <= 2019-10-08 并且失效時(shí)間 > 2019-10-08 的數(shù)據(jù)即可;如果查詢的是 10月9日的數(shù)據(jù),那么篩選條件則是生效時(shí)間 <= 2019-10-09 并且失效時(shí)間 > 2019-10-09;以此類推。

        二、表的創(chuàng)建

        臨時(shí)源表 T_FIN_ACCTION_SRC,接收其它數(shù)據(jù)庫(如 oracle)表推送過來的數(shù)據(jù) ,表結(jié)構(gòu)和源數(shù)據(jù)庫的表結(jié)構(gòu)一致。

        --源表
        create table T_FIN_ACCTION_SRC(
        eNo varchar(6),
        eName varchar(10),
        ePhone varchar(11),
        eData_date date
        );

        目標(biāo)表 ( 即拉鏈表 ) T_FIN_ACCTION_TAR,這里注意的是:拉鏈表把源表的時(shí)間字段改成了生效時(shí)間失效時(shí)間。

        --拉鏈表
        create table T_FIN_ACCTION_TAR(
        eNo varchar(6),
        eName varchar(10),
        ePhone varchar(11),
        sdate date,
        edate date
        );

        三、存儲過程的創(chuàng)建

        在這里為了方便閱讀以及代碼的編寫,先寫出整體的存儲過程架構(gòu),然后我們在一步一步添加代碼:

        -- 將當(dāng)前時(shí)間傳入 (也可以傳入昨天的時(shí)間哦,隨機(jī)應(yīng)變,如果傳入的時(shí)間是今天則使用中要將時(shí)間減一,因?yàn)槲覀円幚淼氖亲蛱斓臄?shù)據(jù))
        create or replace function My_FIN_GL_SUBJECT_PRO(IN P_TODAY VARCHAR)
        returns void
        as $$
        declare

        begin
        --1.目標(biāo)表中沒有此主鍵的則確定為新增 - 新增

        --2.源表中沒有該ID則進(jìn)行關(guān)鏈 - 刪除

        --3.修改
        --3.1 閉鏈:目標(biāo)表中有此主鍵的記錄,狀態(tài)值不同,更新結(jié)束日期為當(dāng)天

        --3.2 開鏈:目標(biāo)表中新增一條修改的數(shù)據(jù),更新結(jié)束日期為無窮大

        end;
        $$
        language plpgsql;

        四、拉鏈的過程實(shí)現(xiàn)

        1.目標(biāo)表中沒有此主鍵的則確定為新增 - 新增

        insert into gplcydb.public.T_FIN_ACCTION_TAR(eNo,eName,ePhone,sdate,edate)  
        select s.eNo,s.eName,s.ePhone,s.eData_date,to_date('2999-12-31','yyyy-mm-dd')
        from gplcydb.public.T_FIN_ACCTION_SRC s
        where s.eData_date=(to_date(P_TODAY,'yyyy-mm-dd') - 1)
        and not exists(
        select 1 from gplcydb.public.T_FIN_ACCTION_TAR t
        where
        s.eNo=t.eNo
        and s.eName=t.eName
        and s.ePhone=t.ePhone
        );

        2.源表中沒有該ID則進(jìn)行關(guān)鏈 - 刪除

        update gplcydb.public.T_FIN_ACCTION_TAR a set edate=(to_date(P_TODAY,'yyyy-mm-dd')-1) 
        where not exists(
        select 1 from gplcydb.public.T_FIN_ACCTION_SRC s
        where
        s.eNo=a.eNo
        and a.edate=to_date('2999-12-31', 'yyyy-mm-dd')
        );

        3.修改

        3.1 閉鏈:目標(biāo)表中有此主鍵的記錄,狀態(tài)值不同,更新結(jié)束日期為當(dāng)天

        update gplcydb.public.T_FIN_ACCTION_TAR b set edate=(to_date(P_TODAY,'yyyy-mm-dd')-1)    
        where b.edate=to_date('2999-12-31','yyyy-mm-dd')
        and exists(
        select 1 from gplcydb.public.T_FIN_ACCTION_SRC s
        where
        s.eNo = b.eNo and b.sdate < (to_date(P_TODAY,'yyyy-mm-dd')-1)
        and (
        s.eName <> b.eName or s.ePhone <> b.ePhone
        )
        );

        3.2 開鏈:目標(biāo)表中新增一條修改的數(shù)據(jù),更新結(jié)束日期為無窮大

        insert into gplcydb.public.T_FIN_ACCTION_TAR(eNo,eName,ePhone,sdate,edate)  
        select s.eNo,s.eName,s.ePhone,(to_date(P_TODAY,'yyyy-mm-dd') - 1),to_date('2999-12-31','yyyy-mm-dd')
        from gplcydb.public.T_FIN_ACCTION_SRC s
        where
        s.eData_date=(to_date(P_TODAY,'yyyy-mm-dd') - 1)
        and exists( --處理數(shù)據(jù)斷鏈新增的情況
        select 1 from (
        select eNo,sdate,max(edate) end_date
        from gplcydb.public.T_FIN_ACCTION_TAR group by eNo,sdate) t
        where
        t.eNo=s.eNo
        and s.eData_date = t.sdate
        and t.end_date <= to_date(P_TODAY,'yyyy-mm-dd')
        );

        五、測試

        要測試?yán)満瘮?shù),首先我們必須要在原表中插入數(shù)據(jù)(模擬一天全量的數(shù)據(jù)):

        insert into T_FIN_ACCTION_SRC values('1001','feiniu','18500000001','2019-10-10');
        insert into T_FIN_ACCTION_SRC values('1002','beibei','18400000005','2019-10-10');
        insert into T_FIN_ACCTION_SRC values('1003','yuyu','13800000005','2019-10-10');

        調(diào)用函數(shù)進(jìn)行拉鏈測試:

        select My_FIN_GL_SUBJECT_PRO('2019-10-11');  --調(diào)用函數(shù)
        select * from T_FIN_ACCTION_TAR; --查詢拉鏈表

        測試結(jié)果如下圖:

        插入第二天全量數(shù)據(jù),這些數(shù)據(jù)中有新增的數(shù)據(jù),有源數(shù)據(jù)被刪除,還有源數(shù)據(jù)被修改,完整的模擬sql語句如下:

        delete from T_FIN_ACCTION_SRC where eno='1003';
        insert into T_FIN_ACCTION_SRC values('1004','kongkong','13800000666','2019-10-11');
        update T_FIN_ACCTION_SRC set ename='xiaofeifei' where eno='1001';
        select * from T_FIN_ACCTION_SRC;

        原表的效果圖如下:

        接下來執(zhí)行拉鏈函數(shù):

        --執(zhí)行拉鏈函數(shù)
        select My_FIN_GL_SUBJECT_PRO('2019-10-12');
        select * from T_FIN_ACCTION_TAR; --查詢目標(biāo)表

        效果圖如下:


        責(zé)編?《大數(shù)據(jù)技術(shù)與架構(gòu)》

        插畫?大數(shù)據(jù)術(shù)架構(gòu)

        封面圖來源?大數(shù)據(jù)術(shù)架構(gòu)

        文章鏈接?https://www.jianshu.com/p/8b28719e0eea


        求分享

        求點(diǎn)贊

        求在看

        瀏覽 46
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产AV 无码 高潮 白桃 91嫩草久久久精品影院狼牙 | 成人免费视频 视频免费看 | 久久国产精品电影 | 国产一级a毛一级a做免费高清视频 | 白鹿大尺度娇喘床戏片段 | 国产a国产片国产 | 欧美性爱三级片 | 夜夜嗨aⅴ免费视频 | 国内操B| 中文字幕乱码一区二区三区四区在线看 |