1. 【科普閑聊】高性能計算機傳奇

        共 3696字,需瀏覽 8分鐘

         ·

        2022-07-09 02:58

        介紹

        高性能計算機是用網(wǎng)絡(luò)多臺計算機連接在一起,并構(gòu)成一個統(tǒng)一的系統(tǒng),從而擁有遠(yuǎn)超個人電腦的計算能力。這樣利用網(wǎng)絡(luò),讓計算機合作工作的并行系統(tǒng)又稱為集群(cluster)。服務(wù)器、分布式計算機、超級計算機都是按照集群的方式組成的。

        服務(wù)器是指在網(wǎng)絡(luò)中為客戶提供服務(wù)的高性能計算機。一臺的服務(wù)器往往在同一時間接收到大量的客戶請求,然后根據(jù)請求啟動大量的任務(wù),以回應(yīng)客戶請求。由于客戶請求之間可能差異很大,所以相應(yīng)的任務(wù)也有大有小。服務(wù)器要均衡負(fù)載,合理分配資源給不同的任務(wù)。

        超級計算機是讓整個集群為同一個任務(wù)工作,以更快的速度來解決一個復(fù)雜問題。與服務(wù)器不同,一臺超級計算機上往往運行一個任務(wù) (或者有限的幾個任務(wù)),所有的計算機資源都被傾注到同一個任務(wù)中。為了解決同一個問題,集群的不同計算機之間要有很好的溝通能力。

        超級計算機適合一些需要并行運算的任務(wù),比如航空航天器設(shè)計、核實驗、天氣預(yù)報、星云模擬等,以便用數(shù)值方法來獲得模擬數(shù)據(jù),所以超級計算機大多位于研究機構(gòu)和大學(xué)中。然而,超級計算機在人工智能領(lǐng)域的應(yīng)用更能攫取公眾注意力。無論是《2001太空漫游》中的HAL,還是打敗國際象棋冠軍卡斯帕羅夫的“深藍(lán)” (Deep Blue)電腦。

        超級計算機深刻影響了流行文化。計算機被看作擁有思維潛能的機器,而超級計算機作為計算機的領(lǐng)軍,更有可能最早以機器身份挑戰(zhàn)人類所自豪的理性思維能力。下圖是不斷被打破的超級計算機紀(jì)錄,中國的天河曾經(jīng)于2010年登頂:

        分布式計算機是隨著信息時代而蓬勃發(fā)展起來的。與上面兩種“真實”集群不同,分布式計算機是構(gòu)建在互聯(lián)網(wǎng)之上的一個"虛擬"集群。個人電腦的配置遠(yuǎn)高于用戶的實際需要,而且用戶也很難滿負(fù)荷的使用個人電腦,所以日常使用的個人電腦上總會有富余的計算能力。隨著互聯(lián)網(wǎng)的發(fā)達(dá),個人電腦的富余計算能力成為一座值得開挖的寶藏。

        分布式計算就是用互聯(lián)網(wǎng)來連接個人電腦,構(gòu)成一個集群。這個集群可以作為一個系統(tǒng)工作,以解決一些復(fù)雜問題。比如Climateprediction.net,參與者可以下載安裝一個小程序,這個小程序會在后臺監(jiān)聽。當(dāng)參與者個人電腦上有空閑資源時(比如長時間不用進入屏保),這些資源就被用來執(zhí)行一些計算任務(wù),從而為氣候變化預(yù)測作出貢獻。

        歷史

        高性能計算機是計算機和網(wǎng)絡(luò)的結(jié)合,它的發(fā)展也與網(wǎng)絡(luò)的發(fā)展同步。如果說互聯(lián)網(wǎng)從外部將分立的計算機連接在一起,那么集群則是將網(wǎng)絡(luò)內(nèi)部化,讓網(wǎng)絡(luò)成為系統(tǒng)內(nèi)部不同計算機的溝通橋梁。首先創(chuàng)造性的發(fā)明集群的是Seymour Cray。

        Seymour Cray是一位美國工程師。在1960年代,能夠進行高性能運算的只能是經(jīng)過特別設(shè)計的、昂貴的大型機。這些大型機需要復(fù)雜的回路以實現(xiàn)高運算頻率,所以其設(shè)計和生產(chǎn)周期都很長。Seymour Cray出于工程師的直覺,認(rèn)為并行的是提高計算機性能的有效方式。所以在CDC公司工作期間,他使用廉價的方式獲得大型機相似的運算能力。他將多個普通的處理器連接起來,并使得這些處理器協(xié)同工作。這就是高性能計算機的原型。很快,Seymour Cray的新架構(gòu)方式被IBM、HP等公司學(xué)習(xí),高性能計算機開始迅速推廣。政府和科研部門采購這種新型的高性能計算機,以取代原有的大型機。高性能計算機為登月計劃等大型科研項目做出了不可磨滅的貢獻。

        然而進入八十年代,隨著芯片的不斷降價以及CPU頻率的不斷提高,個人計算機如同超新星一樣爆發(fā)。個人計算機的計算能力逐漸可以媲美小型機甚至中型機。蘋果、Intel、微軟等公司借PC的東風(fēng)成為PC時代新的王者。隨著政府開始在各個部門配置PC以取代高性能計算機,高性能計算機的市場遭到PC的不斷蠶食。高性能計算機只能退守復(fù)雜運算和公司服務(wù)器市場。但很快,互聯(lián)網(wǎng)為高性能計算機提供了新的領(lǐng)地?;ヂ?lián)網(wǎng)上廣泛采用的服務(wù)器-客戶模式需要一方計算機充當(dāng)服務(wù)器。然而,服務(wù)器往往要應(yīng)對海量的網(wǎng)絡(luò)請求,家庭使用的PC很難應(yīng)付如此眾多的網(wǎng)絡(luò)請求,必須要依賴基于集群的服務(wù)器。網(wǎng)絡(luò)的蓬勃發(fā)展,特別是2000年附近的網(wǎng)絡(luò)泡沫,成就了諸如Sun這樣的服務(wù)器生產(chǎn)商。

        如今,IT業(yè)向云計算發(fā)起沖擊。諸如Google、Apple和Amazon這樣的公司紛紛建立巨大的數(shù)據(jù)中心,以互聯(lián)網(wǎng)為基礎(chǔ),向高性能計算領(lǐng)域迅猛擴張。在個人計算機領(lǐng)域,隨著CPU主頻靠近量子瓶頸,摩爾定律接近失效。個人計算機正在從單核向多核過渡。并行式的高性能計算機很可能在不久的將來成為新的家庭必備。

        硬件與軟件

        從硬件方面,一個高性能計算機中可以包含多個機箱,每個機箱內(nèi)都是一個主機。主機與普通PC并沒有太大不同,都由主板、CPU、內(nèi)存、網(wǎng)卡組成 。機箱常常是非常緊湊的躺在一個架子上。由于高性能計算機有很強的通信需求,所以一個主機上往往有不止一個網(wǎng)卡。

        高性能計算機的主機之間的連接方式可能很復(fù)雜。根據(jù)不同的需要,高性能計算機的內(nèi)部網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)也會不同。一般來說,集群中主機越多,網(wǎng)絡(luò)的拓?fù)湓綇?fù)雜。比如下圖,是對稱的主機連接方式,這些連接方式都適用于科學(xué)運算相關(guān)的場合:

        經(jīng)典的Beowulf連接則由一臺主機統(tǒng)一將來自Internet的請求分配給各個node,適合于網(wǎng)絡(luò)相關(guān)的應(yīng)用:

        從軟件上說,現(xiàn)在的集群大多采用UNIX/Linux系統(tǒng) (Windows NT在服務(wù)器領(lǐng)域也有市場)。此外,集群至少需要:

        • 一套中心管理軟件

        • 構(gòu)建于TCP/IP協(xié)議上的通信軟件,比如MPI和PVM

        • 任務(wù)管理軟件,將任務(wù)分配給不同的主機,并均衡不同主機的負(fù)載

        • 負(fù)責(zé)監(jiān)視和處理異常情況的軟件

        冷卻系統(tǒng)

        散熱是高性能計算機最值得頭痛的地方,所以值得單列出來。高性能計算機需要將多個CPU和大量內(nèi)存集成在一個機箱中,再將機箱密集放在支架上,所以熱源密度大大提高。過高的溫度會迅速燒壞芯片,也會限制高性能計算機的性能。高性能計算機設(shè)計的冷卻系統(tǒng)必須非常強力。通常,配置風(fēng)冷的機房都要額外安裝空調(diào),以便維持較低的室溫。下圖是日本開發(fā)的一款“廉價”超級計算機,用的是非常強力的……風(fēng)扇。

        水冷系統(tǒng)是風(fēng)冷的另一個選擇。舊式的水冷系統(tǒng)是讓水管流過機箱側(cè)壁,以降低整個服務(wù)器機箱的溫度。通常,流入的水大概有十幾度的溫度,而流出水可能二十幾度,進出有七八度的溫差。由于水有很高的熱容,所以可以有效的移除機箱內(nèi)的熱量。

        舊的水冷系統(tǒng)冷卻整個機箱的溫度,但熱量主要是由CPU和內(nèi)存等芯片產(chǎn)生。新一代的水冷系統(tǒng)將水管直接貼近芯片,以更精確的降溫。下圖所示的IBM水冷系統(tǒng)包括黃銅色的管道和包裹在內(nèi)存和芯片周圍的散熱片。這樣的水冷系統(tǒng)有很精密的設(shè)計還有自動調(diào)節(jié)的控濕系統(tǒng),以防止水冷系統(tǒng)生銹。這樣的水冷系統(tǒng)剛剛問世不久,但其高效率已經(jīng)得到業(yè)內(nèi)人士的認(rèn)可。(這樣一套水冷系統(tǒng)價格不菲)

        數(shù)據(jù)中心

        如果說服務(wù)器是對運算能力的第一次集成,那么數(shù)據(jù)中心就是對運算能力的進一步集成。數(shù)據(jù)中心是集中存放和運行服務(wù)器的地方。隨著諸如蘋果、Google這樣的明星網(wǎng)絡(luò)公司出現(xiàn),以及云計算和大數(shù)據(jù)概念的風(fēng)起云涌,其幕后的數(shù)據(jù)中心開始走入公共視野。

        數(shù)據(jù)中心要求有優(yōu)秀的架構(gòu)設(shè)計,網(wǎng)路設(shè)計,電源設(shè)計和空間設(shè)計,以容納海量處理器,并保持整個數(shù)據(jù)中心的穩(wěn)定運行,同時隨時準(zhǔn)備好應(yīng)對斷電等意外。這些數(shù)據(jù)中心每天需要應(yīng)付十億次量級的訪問請求,而這些訪問請求就是諸如Google和Amazon這樣的網(wǎng)絡(luò)公司的命脈。如果google.com域名出現(xiàn)404錯誤(中國之外的地方),Google的股價恐怕就要跳水。

        在穩(wěn)定的基礎(chǔ)上,效率和成本成為越來越重要的考慮。許多數(shù)據(jù)中心所用的硬件都是來自回收站的二手貨 (據(jù)說Google會從回收站拉回成卡車的廢舊處理器)。通過負(fù)載均衡、數(shù)據(jù)庫管理等軟件手段點石成金,舊硬件的性能被充分開發(fā)?!案咝阅苘浖?低成本硬件”的解決方案正在各大網(wǎng)絡(luò)公司占據(jù)主導(dǎo)地位。另一方面,網(wǎng)絡(luò)公司開始嘗試跳過諸如IBM和Sun這樣的服務(wù)器制造商,直接和Intel合作獲得芯片,然后自行組裝服務(wù)器。


        數(shù)據(jù)中心有很多有意的分布在偏遠(yuǎn)的郊區(qū)。除了土地成本的原因之外,位于郊區(qū)的數(shù)據(jù)中心也不用和市區(qū)競爭用電。隨著綠色數(shù)據(jù)中心概念的興起,越來越多人開始關(guān)注數(shù)據(jù)中心可能帶來的能源和環(huán)境問題。Google和蘋果等大公司開始有意的將數(shù)據(jù)中心放在高緯度、高海拔的地區(qū),以享受天然的“空調(diào)”氣溫。另外,數(shù)據(jù)中心也常常選擇在湖泊和河流附近,就地獲得冷卻水。實際上,數(shù)據(jù)中心的單位電FLOPS要遠(yuǎn)超過小型的機房。

        未來與展望

        CPU的加工精度正在靠近量子效應(yīng)所規(guī)定的上限,摩爾定律會在此失效。計算機的主頻很可能在很長一段時間內(nèi)保持穩(wěn)定。并行運算很可能成為下一個熱點。高性能計算機向人們展示硬件上的可能性。然而軟件上,人們的準(zhǔn)備并不充分。傳統(tǒng)的算法必須經(jīng)過更改才能適應(yīng)并行情境。如何優(yōu)化以及標(biāo)準(zhǔn)化并行算法,還遠(yuǎn)遠(yuǎn)沒有一個確定的答案。此外,云平臺會將我們帶往何處,也是一個大大的問號。

        所以,高性能計算機還是一個遠(yuǎn)沒有結(jié)束的傳奇。

        —  —

        歡迎關(guān)注↓↓↓
        發(fā)文不易,如有幫助,辛苦點贊和在看
        瀏覽 119
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
          
          

            1. 女女又爽又黄免费动画 | 啊啊啊啊要高潮了 | 免费精品国产va自在自线 | 国产美女被洋人菊爆 | 丰满美女牲生活免费视频 |