1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        數(shù)據(jù)倉(cāng)庫(kù)研發(fā)規(guī)范(附錄)

        共 2016字,需瀏覽 5分鐘

         ·

        2021-10-17 00:38

        來(lái)源于公眾號(hào):?數(shù)據(jù)倉(cāng)庫(kù)與Python大數(shù)據(jù)


        數(shù)據(jù)倉(cāng)庫(kù)研發(fā)規(guī)范整體流程

        下圖為根據(jù)階段規(guī)劃與角色職責(zé)的內(nèi)容,整理出的數(shù)據(jù)倉(cāng)庫(kù)研發(fā)規(guī)范的整體流程。



        附錄


        • 數(shù)據(jù)倉(cāng)庫(kù)需求模板

        • 數(shù)據(jù)探查報(bào)告

        • ETL文檔

        • 調(diào)度設(shè)計(jì)文檔

        • 單元測(cè)試報(bào)告

        • 發(fā)布操作文檔

        • 代碼評(píng)審報(bào)告

        • 測(cè)試分析方案報(bào)告

        • 交付測(cè)試報(bào)告

        • 質(zhì)量評(píng)估報(bào)告模板

        • 驗(yàn)收?qǐng)?bào)告模板



        一、數(shù)據(jù)倉(cāng)庫(kù)需求模板


        本章節(jié)將為您介紹數(shù)據(jù)倉(cāng)庫(kù)需求模板、常規(guī)需求申請(qǐng)單和迭代需求申請(qǐng)單。

        填寫說(shuō)明:

        • *為必填項(xiàng)目,其它可以選擇性進(jìn)行填寫。

        • 指標(biāo)邏輯可以引用指標(biāo)和術(shù)語(yǔ)(或指標(biāo)庫(kù))中的定義。

        • 如果數(shù)據(jù)范圍、更新頻率、時(shí)間窗口、數(shù)據(jù)提供形式和表頭信息不一致,可以針對(duì)指標(biāo)項(xiàng)單獨(dú)說(shuō)明。

        • 如果涉及到數(shù)據(jù)提供或數(shù)據(jù)交互,數(shù)據(jù)驗(yàn)收人、待驗(yàn)收數(shù)據(jù)樣本和數(shù)據(jù)驗(yàn)收方式為必填項(xiàng),其它項(xiàng)并非強(qiáng)制需求。


        數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)需求模板


        數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)需求模板
        需求申請(qǐng)需求申請(qǐng)人*
        需求使用方*
        期望完成日期*
        需求類型*
        需求目的需求背景*
        期望目標(biāo)*
        應(yīng)用系統(tǒng)名
        應(yīng)用系統(tǒng)聯(lián)系人
        需求內(nèi)容需求概覽需求范圍*描述此次需求涉及的范圍(可以從人群特征,業(yè)務(wù)場(chǎng)景等維度定義數(shù)據(jù)范圍、改造哪些表等)。
        包含的指標(biāo)多個(gè)指標(biāo)以逗號(hào)分隔。如果指標(biāo)較多,可以在日常業(yè)務(wù)需求附表中的指標(biāo)名稱一欄填寫。
        數(shù)據(jù)交互方式涉及到數(shù)據(jù)輸出的,需要描述數(shù)據(jù)的交互方式、格式等。
        附件說(shuō)明如果有附件需要補(bǔ)充的,請(qǐng)?jiān)诖苏f(shuō)明,并同步附加附件。
        項(xiàng)目涉眾數(shù)據(jù)產(chǎn)品經(jīng)理
        設(shè)計(jì)人員
        開(kāi)發(fā)人員
        測(cè)試人員
        數(shù)據(jù)安全與合規(guī)人員
        需求版本變更歷史
        版本號(hào)版本確認(rèn)日期版本變更點(diǎn)提交人




        常規(guī)需求申請(qǐng)單

        指標(biāo)需求中通常會(huì)涉及到下表中的約定項(xiàng),如果需要自定義約定項(xiàng),可以在自定義格式列進(jìn)行填寫。


        約定項(xiàng)默認(rèn)格式自定義格式
        日期yyyymmdd
        比率值4位小數(shù)點(diǎn)
        時(shí)間戳yyyy-mm-dd hh24:mi:ss,格林尼治時(shí)間。
        金額單位為分。
        時(shí)間粒度日:T-1日的00:00~24:00。
        周:周一到周日,對(duì)應(yīng)指標(biāo)僅周日有值。
        月:自然月,對(duì)應(yīng)指標(biāo)僅月末最后一天有值。
        年累計(jì):自然年,1月1日到T-1。
        財(cái)年累計(jì):財(cái)年4月1日到T-1。

        約定項(xiàng)填寫內(nèi)容約定項(xiàng)填寫內(nèi)容
        時(shí)間窗口(歷史數(shù)據(jù)要求)*
        存儲(chǔ)周期*
        更新頻率(日、周、月、小時(shí)、分鐘、其它)*
        期望數(shù)據(jù)更新時(shí)間*
        數(shù)據(jù)驗(yàn)收人
        待驗(yàn)收數(shù)據(jù)樣本
        數(shù)據(jù)驗(yàn)收方式
        數(shù)據(jù)提供形式
        • 物理表

        • 數(shù)據(jù)文件

        • 數(shù)據(jù)查詢服務(wù)或接口

        備注













        ?NO.

        粒度

        目錄

        接口表

        指標(biāo)名稱*

        指標(biāo)邏輯*

        空值/異常值處理*

        監(jiān)控項(xiàng)

        值是否唯一*

        數(shù)據(jù)來(lái)源*

        安全等級(jí)*

        備注





































        1


        迭代需求申請(qǐng)單


        數(shù)據(jù)倉(cāng)庫(kù)需求變更申請(qǐng)單
        需求變更申請(qǐng)原始需求ID*
        需求申請(qǐng)人*
        需求使用方*
        期望完成日期*
        需求變更原因需求變更背景*
        是否可以在需求評(píng)審前預(yù)知*
        如何避免此類變更發(fā)生*
        需求變更內(nèi)容原始需求(對(duì)于新增的需求,填無(wú))*變更內(nèi)容*變更類型*





        二、代碼評(píng)審報(bào)告


        代碼評(píng)審要求


        用例小類測(cè)試要點(diǎn)說(shuō)明是否已檢查
        數(shù)據(jù)一致性測(cè)試主鍵唯一性產(chǎn)出表必須有物理主鍵或邏輯主鍵,且在數(shù)據(jù)上主鍵成立。
        主鍵和外鍵邏輯關(guān)系檢查設(shè)計(jì)文檔里關(guān)于主外鍵的設(shè)計(jì)是否在開(kāi)發(fā)階段得以實(shí)現(xiàn),且在數(shù)據(jù)上成立,例如是否存在外鍵丟失。
        系統(tǒng)/業(yè)務(wù)間格式和類型一致性檢查檢查設(shè)計(jì)文檔描述的字段定義是否與實(shí)際值一致。例如日期是否包含時(shí)分秒,金額字段是否為Double,單位為元/分,保留小數(shù)位數(shù)。
        業(yè)務(wù)來(lái)源一致性檢查從同樣業(yè)務(wù)來(lái)源的指標(biāo)是否在數(shù)據(jù)上一致。例如同樣是余額指標(biāo),數(shù)據(jù)來(lái)源是否一致或來(lái)自同一加工鏈路,如果不是,則結(jié)果是否一致。
        同名邏輯定義檢查字段或邏輯定義相同,是否存在值不一樣的情況。例如同樣是貸款發(fā)放額,不同的表之間數(shù)據(jù)是否一致。
        數(shù)據(jù)完整性數(shù)據(jù)獲取是否完整代碼中的數(shù)據(jù)獲取邏輯是否完整。例如累計(jì)客戶數(shù),是否完整包含了歷史上有效存在,但當(dāng)前不存在的客戶。
        邊界值檢查代碼中對(duì)于邊界值的處理是否正確。例如最近30天包含今天但不包含第前30天的。例如日期篩選是否為雙閉區(qū)間。
        過(guò)濾條件完整性過(guò)濾條件是否完整。例如篩選當(dāng)前有效會(huì)員需要加上會(huì)員狀態(tài)的限制。
        指標(biāo)間邏輯檢查同表字段間邏輯檢查同表不同字段間在業(yè)務(wù)上存在的邏輯是否在數(shù)據(jù)上成立。例如貸款為結(jié)清狀態(tài),則結(jié)清日期一定非空;狀態(tài)為逾期,則逾期金額一定大于0。
        跨表/跨系統(tǒng)邏輯檢查跨表/跨系統(tǒng)間在業(yè)務(wù)上存在的邏輯是否在數(shù)據(jù)上成立。例如不良貸款余額>0,則該賬戶三級(jí)分類應(yīng)為次級(jí)、可疑和損失。

        代碼評(píng)審測(cè)試用例記錄


        備注測(cè)試結(jié)果測(cè)試結(jié)果備注是否轉(zhuǎn)化監(jiān)控監(jiān)控閾值創(chuàng)建日期創(chuàng)建人所屬項(xiàng)目名稱
        檢查主鍵的唯一性通過(guò)
        <12019/3/16XXX訂單主題分析



        三、驗(yàn)收?qǐng)?bào)告模板


        測(cè)試驗(yàn)收點(diǎn)


        序號(hào)測(cè)試驗(yàn)證點(diǎn)(按實(shí)際情況增減)是否通過(guò)
        1數(shù)據(jù)主鍵是否重復(fù)。
        2結(jié)果數(shù)據(jù)的明細(xì)分布,包括數(shù)據(jù)量、空值、均值及其他相關(guān)業(yè)務(wù)指標(biāo)的分布。
        3抽樣檢查:與需求設(shè)定時(shí)的抽樣樣本進(jìn)行對(duì)比,查看是否存在差異。
        4如果是迭代需求,需要與一期的結(jié)果進(jìn)行對(duì)比,查看數(shù)據(jù)量差異、明細(xì)差異等。
        5某些數(shù)值型結(jié)果機(jī)型同比、環(huán)比,獲得大概增長(zhǎng)率和變化范圍,判斷數(shù)據(jù)的正確性。

        需求實(shí)現(xiàn)情況

        • 已實(shí)現(xiàn)內(nèi)容。

        • 未實(shí)現(xiàn)內(nèi)容:需要說(shuō)明未實(shí)現(xiàn)的原因。

        發(fā)現(xiàn)問(wèn)題列表


        序號(hào)問(wèn)題描述風(fēng)險(xiǎn)影響分析風(fēng)險(xiǎn)等級(jí)建議跟進(jìn)負(fù)責(zé)人
        Delay_1由于XX API回參格式限制,XX字段返回結(jié)果無(wú)法適配計(jì)算引擎字段類型。接口改造需花費(fèi)X天,導(dǎo)致項(xiàng)目整體進(jìn)度Delay X天。張三

        驗(yàn)收評(píng)估結(jié)果

        業(yè)務(wù)方(數(shù)據(jù)產(chǎn)品經(jīng)理):通過(guò)/不通過(guò)。

        驗(yàn)收通過(guò)。遺留的問(wèn)題在本項(xiàng)目中可以接受,但Delay_1缺陷必須在xxxx年x月x日之前啟動(dòng)升級(jí)包修復(fù)。



        四、交付測(cè)試報(bào)告


        代碼交付情況

        關(guān)鍵指標(biāo)包括BUG(每輪測(cè)試發(fā)現(xiàn)的缺陷總數(shù))、執(zhí)行率和通過(guò)率。


        文檔交付情況



        文檔測(cè)試準(zhǔn)入條件



        交付測(cè)試遺留問(wèn)題

        記錄交付測(cè)試通過(guò)后,遺留在功能測(cè)試階段未解決的問(wèn)題。



        五、單元測(cè)試報(bào)告

        單元測(cè)試要求


        用例小類測(cè)試要點(diǎn)說(shuō)明是否已檢查(Y/N)
        規(guī)范性命名規(guī)范檢查(表、視圖、工作流、字段)是否符合MaxCompute數(shù)倉(cāng)建設(shè)規(guī)范管理指南中命名規(guī)范的表命名規(guī)范。
        代碼格式和注釋規(guī)范性是否符合MaxCompute數(shù)倉(cāng)建設(shè)規(guī)范管理指南中的編碼規(guī)范。
        表引用規(guī)范性數(shù)據(jù)不允許跨層引用。
        表更新策略規(guī)范建議臨時(shí)表均為非分區(qū)表,正式表均為分區(qū)表。
        是否支持重跑代碼必須支持重跑。
        源數(shù)據(jù)質(zhì)量非空值檢查檢查所用字段是否存在空值,以及代碼對(duì)空值處理的策略是否正確。
        字段枚舉值檢查字段的枚舉值是否都在代碼考慮范圍內(nèi),是否有可能會(huì)出現(xiàn)新值。
        主鍵檢查物理主鍵或邏輯主鍵是否成立。
        數(shù)據(jù)完整性檢查代碼中引用的數(shù)據(jù)能否支撐實(shí)際需求。
        字段間邏輯檢查字段間的業(yè)務(wù)邏輯關(guān)系是否在數(shù)據(jù)上成立,例如余額=總的發(fā)放-總的回收。
        代碼質(zhì)量/BUG檢查歷史拉鏈表檢查斷鏈/交叉鏈使用標(biāo)準(zhǔn)SQL進(jìn)行檢驗(yàn)。
        數(shù)據(jù)傾斜檢查是否存在傾斜的情況,是否有大表join小表未用mapjoin等。
        表分區(qū)選擇檢查代碼對(duì)表分區(qū)的選擇是否正確。
        關(guān)聯(lián)條件檢查關(guān)聯(lián)條件是否正確,是否會(huì)產(chǎn)生意料外的結(jié)果,例如多對(duì)多關(guān)聯(lián)、笛卡爾積。
        字段類型檢查字段類型是否正確,例如:金額字段必須為X數(shù)據(jù)類型,編號(hào)字段必須為X數(shù)據(jù)類型。
        執(zhí)行效率檢查單條SQL執(zhí)行時(shí)間不超過(guò)30分鐘,單個(gè)腳本執(zhí)行時(shí)間不超過(guò)60分鐘。
        數(shù)倉(cāng)特殊需求臟數(shù)據(jù)檢查檢查是否有臟數(shù)據(jù)。
        增量/全量數(shù)據(jù)抽取規(guī)范抽取時(shí)間大于X分鐘的,則考慮更改為增量抽取。
        數(shù)倉(cāng)抽取時(shí)間點(diǎn)檢查數(shù)倉(cāng)抽取時(shí)業(yè)務(wù)系統(tǒng)是否ready,抽取的數(shù)據(jù)是否完整。
        指標(biāo)特性檢查細(xì)分指標(biāo)趨勢(shì)檢查例如會(huì)員拉鏈表記錄數(shù)相比前一天必須是正增長(zhǎng)、當(dāng)日累計(jì)值-上日累計(jì)值必須大于0。
        不同粒度數(shù)據(jù)轉(zhuǎn)換正確性例如細(xì)粒度向粗粒度匯總,通常使用最大/最高/最小/最低等過(guò)濾條件,如:支用層逾期天數(shù)轉(zhuǎn)換到客戶層指標(biāo)(最高逾期天數(shù))。最高逾期天數(shù) = Max(支用層逾期天數(shù))。
        值域范圍檢查檢查字段值的范圍是否正確,如:金額>=0,比率<=1,天數(shù)<=業(yè)務(wù)起始日期至今,還款日期>=放款日期。
        代碼值分布檢查從業(yè)務(wù)邏輯考量字段值的分布情況是否合理。
        可累加值與不可累加值檢查檢查可累加值和不可累加值的處理邏輯正確性,如:計(jì)算客戶數(shù)總計(jì)時(shí)需要做去重處理,金額則可以累加。

        單元測(cè)試用例記錄


        序號(hào)用例大類測(cè)試要點(diǎn)字段自定義表達(dá)式備注
        1規(guī)范性命名規(guī)范檢查(表、視圖、工作流、字段)jrcdm_agt_ovd_ins_detail_fact_dd


        2規(guī)范性是否支持重跑jrcdm_agt_ovd_ins_detail_fact_dd


        3源數(shù)據(jù)質(zhì)量主鍵檢查afclms_clms_loan_contractcontract_no

        4指標(biāo)特性檢查值域范圍檢查jrcdm_cust_drawndn_fact_dsprin_max_ovd_days, inte_max_ovd_daysprin_max_ovd_days>=inte_max_ovd_days檢驗(yàn)逾期天數(shù)的業(yè)務(wù)邏輯。
        5指標(biāo)特性檢查值域范圍檢查x_jredw_da_drawndn_ovd_date_infoPrin_Ovd_Start_DtPrin_Ovd_Start_Dt<=Prin_Ovd_End_Dt, Inte_Ovd_Start_Dt <=Inte_Ovd_End_Dt檢查業(yè)務(wù)邏輯正確性。

        測(cè)試結(jié)果測(cè)試結(jié)果備注是否轉(zhuǎn)化監(jiān)控監(jiān)控閾值創(chuàng)建日期創(chuàng)建人所屬項(xiàng)目名稱
        通過(guò)


        2013/7/16XXX某項(xiàng)目
        通過(guò)


        2013/7/16XXX某項(xiàng)目
        通過(guò)


        2013/7/16XXX某項(xiàng)目
        通過(guò)
        <12013/7/16XXX某項(xiàng)目
        未通過(guò)開(kāi)發(fā)代碼中存在以下兩個(gè)問(wèn)題:
        • 未對(duì)期次還款日大于當(dāng)前日期的記錄進(jìn)行過(guò)濾,這部分為未到期記錄,需要排除。

        • 未對(duì)記錄中創(chuàng)建時(shí)間小于期次還款日的、未結(jié)清的期次記錄的逾期結(jié)束時(shí)間,賦予與逾期開(kāi)始時(shí)間一致的處理。

        <12013/7/16XXX某項(xiàng)目



        六、發(fā)布操作文檔



        序號(hào)節(jié)點(diǎn)ID文件名發(fā)布次序是否需要生產(chǎn)冒煙是否需要重跑歷史數(shù)據(jù)重跑歷史時(shí)間段發(fā)布驗(yàn)證是否通過(guò)
        1xxxxxdw_user_log_info_d.sql1YY20190326-20190426Y



        七、數(shù)據(jù)探查報(bào)告


        數(shù)據(jù)探查報(bào)告模板,如下表所示。


        字段順序字段名字段注釋字段類型總行數(shù)空值個(gè)數(shù)



















        空值比例唯一個(gè)數(shù)均值(number)::TOP1(string)最小值::TOP21%分位數(shù)::TOP35%分位數(shù)::TOP4



















        25%分位數(shù)::TOP5中位數(shù)::BOT575%分位數(shù)::BOT495%分位數(shù)::BOT399%分位數(shù)::BOT2最大值::BOT1




















        八、質(zhì)量評(píng)估報(bào)告模板


        測(cè)試情況說(shuō)明

        • 測(cè)試用例執(zhí)行通過(guò)率:0%~100%。

        • 每日發(fā)現(xiàn)故障趨勢(shì)圖。

        • 線下缺陷嚴(yán)重程度分類。

        需求實(shí)現(xiàn)說(shuō)明

        • 需求覆蓋率(在測(cè)分文檔中,需求與功能對(duì)應(yīng)列表為準(zhǔn)):0%~100%。

        • 需求變更情況:包括已走正式流程的需求變更,郵件通告的需求變更,以及當(dāng)前功能改動(dòng)了原有需求的說(shuō)明。


          階段說(shuō)明分類
          測(cè)分階段增加老會(huì)員模式下添加銀行卡的出錯(cuò)情況提示。需求變更
          老會(huì)員添加卡的流程中,增加生僻字用戶的判斷。需求變更
          增加推薦規(guī)則模板:推薦規(guī)則為空時(shí)的展示方式。需求變更
        • 未實(shí)現(xiàn)需求:請(qǐng)說(shuō)明需求未實(shí)現(xiàn)的原因。

        遺留問(wèn)題列表


        序號(hào)問(wèn)題描述風(fēng)險(xiǎn)影響分析風(fēng)險(xiǎn)等級(jí)建議跟進(jìn)負(fù)責(zé)人
        Delay_1由于XX API回參格式限制,XX字段返回結(jié)果無(wú)法適配計(jì)算引擎字段類型。接口改造需花費(fèi)X天,導(dǎo)致項(xiàng)目整體進(jìn)度Delay X天。XXX

        質(zhì)量評(píng)估結(jié)果

        • 測(cè)試是否通過(guò)

        • 保留建議

          遺留的問(wèn)題在本項(xiàng)目中可以接受,但Delay_1缺陷必須在XXX年X月X日之前啟動(dòng)升級(jí)包修復(fù)。




        免責(zé)聲明:

        本公眾號(hào)所有分享的軟件和資料來(lái)自網(wǎng)絡(luò)收集和整理,所有文字和圖片版權(quán)歸屬于原作者所有,且僅代表作者個(gè)人觀點(diǎn),與數(shù)據(jù)工匠俱樂(lè)部無(wú)關(guān),文章僅供讀者學(xué)習(xí)交流使用,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容,文章內(nèi)容涉及侵權(quán),請(qǐng)聯(lián)系后臺(tái)管理員刪除


        (歡迎大家加入數(shù)據(jù)工匠知識(shí)星球獲取更多資訊。)

        聯(lián)系我們

        掃描二維碼關(guān)注我們

        微信:SZH9543
        郵箱:[email protected]
        QQ:2286075659

        熱門文章


        云智一體在滬啟航,百度智能云助力企業(yè)發(fā)揮大數(shù)據(jù)核心價(jià)值


        終于有人把DevOps講明白了


        終于有人把AI、BI、大數(shù)據(jù)、數(shù)據(jù)科學(xué)講明白了


        工信部:將推動(dòng)建立數(shù)據(jù)產(chǎn)權(quán)制度、完善數(shù)據(jù)競(jìng)爭(zhēng)規(guī)則


        數(shù)字化和數(shù)據(jù)平臺(tái)——企業(yè)數(shù)字化轉(zhuǎn)型的技術(shù)架構(gòu)升級(jí)


        構(gòu)建大數(shù)據(jù)知識(shí)管理體系,向世界一流企業(yè)邁進(jìn)


        數(shù)字化轉(zhuǎn)型規(guī)劃的體系化思考


        IT建設(shè)目標(biāo)及IT規(guī)劃初步方案(內(nèi)附下載鏈接)

        我們的使命:發(fā)展數(shù)據(jù)治理行業(yè)、普及數(shù)據(jù)治理知識(shí)、改變企業(yè)數(shù)據(jù)管理現(xiàn)狀、提高企業(yè)數(shù)據(jù)質(zhì)量、推動(dòng)企業(yè)走進(jìn)大數(shù)據(jù)時(shí)代。

        我們的愿景:打造數(shù)據(jù)治理專家、數(shù)據(jù)治理平臺(tái)、數(shù)據(jù)治理生態(tài)圈。

        我們的價(jià)值觀:凝聚行業(yè)力量、打造數(shù)據(jù)治理全鏈條平臺(tái)、改變數(shù)據(jù)治理生態(tài)圈。

        了解更多精彩內(nèi)容


        長(zhǎng)按,識(shí)別二維碼,關(guān)注我們吧!

        數(shù)據(jù)工匠俱樂(lè)部

        微信號(hào):zgsjgjjlb

        專注數(shù)據(jù)治理,推動(dòng)大數(shù)據(jù)發(fā)展。

        瀏覽 80
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            国产精品V亚洲精品V日韩精品 | 边摸边吃奶边做爽gif动态图 | 亚洲精品91 | 加勒比不卡AV | 女技师三级做爰按摩电影 | 成人大片免费看 | 四虎视频国产精品免费 | 精品午夜一区二区三区在线观看 | 337p人体粉嫩鲍高清视频 | 高潮喷水在线 |