1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        詳解數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)維——上下文

        共 2421字,需瀏覽 5分鐘

         ·

        2021-03-11 20:44

        「數(shù)倉(cāng)寶貝庫(kù)」,帶你學(xué)數(shù)據(jù)!


        過(guò)去,典型的操作型信息系統(tǒng)將注意力集中在企業(yè)的當(dāng)前數(shù)據(jù)上。在操作型世界中,強(qiáng)調(diào)的重點(diǎn)是此刻賬目的余額是多少,此刻的存貨有多少,或此刻貨物的運(yùn)送情況如何。當(dāng)然,任何一個(gè)企業(yè)都有必要知道當(dāng)前的信息。但對(duì)過(guò)去一段時(shí)間的信息進(jìn)行考察也有真正的價(jià)值,并且,在有了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)以后,這個(gè)要求變得可能了。例如,對(duì)歷史信息進(jìn)行觀察就可以明顯地看到相應(yīng)的發(fā)展趨勢(shì),而僅僅查看當(dāng)前信息是看不到這一點(diǎn)的。數(shù)據(jù)倉(cāng)庫(kù)定義中的一個(gè)最重要特征就是能夠?qū)σ欢螘r(shí)間內(nèi)的數(shù)據(jù)進(jìn)行存儲(chǔ)、管理和訪問(wèn)。


        伴隨著作為數(shù)據(jù)倉(cāng)庫(kù)一部分的足夠長(zhǎng)的時(shí)間譜,出現(xiàn)了一個(gè)新的數(shù)據(jù)維—上下文。為了闡明上下文信息的重要性,下面給出了一個(gè)例子。



        例子


        假定一個(gè)管理者想從數(shù)據(jù)倉(cāng)庫(kù)中要一份1995年的報(bào)表。報(bào)表生成后,管理者很滿意。事實(shí)上,由于管理者很滿意,所以想要一份1990年的報(bào)表。由于數(shù)據(jù)倉(cāng)庫(kù)載有歷史信息,這樣的要求并不難實(shí)現(xiàn)。1990年的報(bào)表生成了?,F(xiàn)在,管理者手上有兩份報(bào)表—1990年和1995年各一份,并宣布這些報(bào)表是一場(chǎng)災(zāi)難。



        數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)設(shè)計(jì)者檢查了報(bào)表,發(fā)現(xiàn)1995年的財(cái)政報(bào)告顯示收入為50 000 000美元,而1990年的報(bào)告對(duì)同一種類顯示為10 000美元。管理者宣稱任何賬戶或分類都不可能在5年時(shí)間內(nèi)就增長(zhǎng)這么多。



        就在要放棄之前,數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)設(shè)計(jì)者向管理者指出,還有一些相關(guān)的因素沒(méi)有在報(bào)表中體現(xiàn)出來(lái)。1990年和1995年的數(shù)據(jù)是從不同來(lái)源得到的;1990年的產(chǎn)品定義不同于1995年的;1990年和1995年有不同的市場(chǎng)范圍;1990年和1995年有不同的計(jì)算方法,如針對(duì)貶值問(wèn)題。另外,還有許多不同的外部因素需要考慮,如在通貨膨脹、稅款、經(jīng)濟(jì)預(yù)測(cè)等方面的差別。一旦把報(bào)表的上下文向管理者解釋之后,內(nèi)容就在相當(dāng)程度上顯得可接受。



        在這個(gè)簡(jiǎn)單而又常見(jiàn)的例子中,如果隨著時(shí)間變化數(shù)據(jù)的內(nèi)容沒(méi)有任何附加信息,那么內(nèi)容本身就是非常難于解釋和難以令人相信的。然而,隨著時(shí)間的變化同時(shí),把上下文加入到數(shù)據(jù)的內(nèi)容上,內(nèi)容和上下文都變得非常明了。


        為了解釋和理解一段時(shí)間內(nèi)的信息,需要一個(gè)全新的上下文維。雖然信息的內(nèi)容仍十分重要,但是,一段時(shí)間內(nèi)信息的比較和理解使得上下文和內(nèi)容具有同等的重要性。而在過(guò)去的幾年中,上下文一直是信息的一個(gè)未被發(fā)現(xiàn)、未被探索的維。



        上下文信息的三種類型


        需要管理三種級(jí)別的上下文信息:

        1.簡(jiǎn)單上下文信息。

        2.復(fù)雜上下文信息。

        3.外部上下文信息。


        簡(jiǎn)單上下文信息



        簡(jiǎn)單上下文信息與數(shù)據(jù)本身的基本結(jié)構(gòu)有關(guān),包括如下一些內(nèi)容:

        ■ 數(shù)據(jù)的結(jié)構(gòu)。

        ■ 數(shù)據(jù)的編碼。

        ■ 數(shù)據(jù)的命名習(xí)慣。

        ■ 描述數(shù)據(jù)的度量,如:

        • 數(shù)據(jù)量有多少。

        • 數(shù)據(jù)增長(zhǎng)速度。

        • 數(shù)據(jù)的哪一部分在增長(zhǎng)。

        • 數(shù)據(jù)是如何被使用的。


        以往,簡(jiǎn)單上下文信息用字典、目錄、系統(tǒng)監(jiān)視器等進(jìn)行管理。復(fù)雜上下文信息描述的數(shù)據(jù)和簡(jiǎn)單上下文信息描述的相同,但是從不同的角度進(jìn)行描述。復(fù)雜上下文信息如下說(shuō)明數(shù)據(jù):

        • 產(chǎn)品定義。

        • 市場(chǎng)范圍。

        • 定價(jià)。

        • 包裝。

        • 組織結(jié)構(gòu)。

        • 配送。



        復(fù)雜上下文信息


        復(fù)雜上下文信息是一些非常有用,同時(shí)又是非常難以捉摸的信息。難以捉摸是因?yàn)樗蝗藗兿氘?dāng)然,并存在于背景環(huán)境中。它非常基本,以致于沒(méi)有人會(huì)想到要定義它是什么,或怎樣隨時(shí)間變化。然而,長(zhǎng)期下去,復(fù)雜上下文信息在理解和解釋一段時(shí)間內(nèi)的信息方面有著非常重要的作用。


        外部上下文信息是處于企業(yè)之外的、在理解隨時(shí)間變化的信息方面起重要作用的信息。外部上下文信息的實(shí)例包括:

        ■ 經(jīng)濟(jì)預(yù)測(cè):

        • 通貨膨脹。

        • 金融。

        • 稅務(wù)。

        • 經(jīng)濟(jì)增長(zhǎng)。

        ■ 政治信息。

        ■ 競(jìng)爭(zhēng)信息。

        ■ 技術(shù)進(jìn)展。

        ■ 用戶人數(shù)的統(tǒng)計(jì)變動(dòng)。



        外部上下文信息


        外部上下文信息并沒(méi)有直接指出關(guān)于一個(gè)企業(yè)的任何事情,但指出了企業(yè)運(yùn)轉(zhuǎn)和競(jìng)爭(zhēng)中所處的大環(huán)境??紤]到外部上下文信息的立即顯現(xiàn)和隨時(shí)間變化的特性,外部上下文信息是很令人感興趣的。同復(fù)雜上下文信息一樣,很少會(huì)有企業(yè)嘗試去采集和量度這些信息。外部上下文信息非常之多,也很顯然,以致被人們想當(dāng)然,因此,它會(huì)很快被遺忘,而在需要時(shí)卻又很難重建。



        捕獲和管理上下文信息



        復(fù)雜上下文信息和外部上下文信息難以捕獲和確定,是因?yàn)檫@些信息都是非結(jié)構(gòu)化的。與簡(jiǎn)單上下文信息相比較,外部上下文信息和復(fù)雜上下文信息顯得非常雜亂無(wú)章。另外的一個(gè)較輕的因素是上下文信息變化很快。這一刻相關(guān)的信息,在下一時(shí)刻就消失了。正是因?yàn)橥獠亢蛷?fù)雜上下文信息的這些不斷變化和沒(méi)有固定狀態(tài)的特點(diǎn),使得這種類型的信息難于系統(tǒng)化。



        回顧上下文信息管理歷史



        有人可能會(huì)爭(zhēng)辯說(shuō),信息系統(tǒng)行業(yè)在過(guò)去已經(jīng)有了上下文信息。字典、知識(shí)庫(kù)、目錄和庫(kù)都是用來(lái)管理簡(jiǎn)單上下文信息的嘗試。盡管有這些好的想法,但存在的一些明顯的局限性大大地降低了它們的有效性。下面給出以往管理簡(jiǎn)單上下文信息的方法存在的一些缺點(diǎn):

        • 信息的管理是針對(duì)信息系統(tǒng)的開(kāi)發(fā)者,而不是最終用戶。這樣,對(duì)于最終用戶有很少的可視性。結(jié)果,最終用戶對(duì)并不明顯的事情沒(méi)有什么熱情,或者不支持這樣的事情。

        • 這些上下文信息管理的嘗試都是被動(dòng)的。開(kāi)發(fā)者可以選擇用或不用這些上下文信息管理工具,很多人傾向于回避這些工具。

        • 這些上下文信息管理的計(jì)劃在很多情況下都會(huì)被從開(kāi)發(fā)計(jì)劃中刪除。在許多的實(shí)例中,應(yīng)用是在1965年開(kāi)發(fā)的,而數(shù)據(jù)字典是1985年做的,而到了1985年,就再也沒(méi)有更多的開(kāi)發(fā)經(jīng)費(fèi)了。甚至,那些對(duì)組織和定義簡(jiǎn)單上下文信息最有幫助的人早已改行或到了其他公司了。

        • 這些上下文信息管理的嘗試僅局限于簡(jiǎn)單上下文信息,并沒(méi)有嘗試去捕獲或管理外部和復(fù)雜上下文信息。



        作者簡(jiǎn)介:

        William H.Inmon,世界公認(rèn)的“數(shù)據(jù)倉(cāng)庫(kù)之父”,企業(yè)信息工廠創(chuàng)造者之一。


        瀏覽 47
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            黄色小说漫画 | 草久久久| 国产做爰又粗又大又硬又大视频 | 色狠狠色噜噜AV天堂 | 日日澡澡夜夜澡澡毛片 | 免费看黄色国产视屏 | 啊老师嗯轻一点动态 | 做爱免费视频网站 | 搞黄视频在线看 | 水多多在线成人免费视频 |