Docker 為什么這么牛?
點擊關(guān)注公眾號,Java干貨及時送達(dá)
1. Docker出現(xiàn)的背景
在平常的研發(fā)和項目場景中,以下情況普遍存在:
個人開發(fā)環(huán)境 為了做大數(shù)據(jù)相關(guān)項目,需要安裝一套CDH集群,常見的做法是在自己電腦里搭建3臺與CDH版本對應(yīng)的虛擬機,把CDH集群裝起來后,考慮到以后很有可能還要使用一個干凈的CDH集群,為了避免以后重復(fù)安裝環(huán)境,通常會對整套CDH集群做一個備份,這樣電腦里就有6個虛擬機鏡像了。另外,后面在學(xué)習(xí)其他技術(shù)時,比如學(xué)習(xí)Ambari大數(shù)據(jù)集群,那么為了不破壞已有的虛擬機環(huán)境,又要重新搭建3臺虛擬機,本機磁盤很快被一大堆的虛擬機鏡像占滿。 公司內(nèi)部開發(fā)環(huán)境 公司里往往會以小團隊的方式來做項目,一般由運維部門從他們管理的服務(wù)器資源中分配出虛擬機供團隊內(nèi)部開發(fā)測試使用。 比如做一個與機器學(xué)習(xí)相關(guān)的項目: 1)小明在運維部門分配的虛擬機上搭建了一套Ambari集群,拿來跑大數(shù)據(jù)相關(guān)業(yè)務(wù) 開發(fā)/測試/現(xiàn)場環(huán)境 研發(fā)人員在開發(fā)環(huán)境里寫好了代碼做好測試后,提交給測試部門,測試人員在測試環(huán)境跑起來發(fā)現(xiàn)有BUG,研發(fā)人員說在開發(fā)環(huán)境沒這個BUG,和測試人員多次扯皮解決BUG后發(fā)布版本,發(fā)到現(xiàn)場在生產(chǎn)環(huán)境部署后,又發(fā)現(xiàn)有BUG,這下輪到工程人員和測試人員扯皮。有時候為了兼容特殊的現(xiàn)場環(huán)境,還需要對代碼進行定制化修改,拉出分支,這樣導(dǎo)致了每次到現(xiàn)場升級都是一場噩夢 升級或遷移項目 在每次發(fā)版本要升級到現(xiàn)場時,如果現(xiàn)場起了多個tomcat應(yīng)用,那么需要對每個tomcat都先停掉,替換war包,然后再起起來,輪流著做,不僅繁瑣而且很容易出錯,如果遇到升級后出現(xiàn)嚴(yán)重BUG,還要手工做回退。另外,如果項目想上云,那么在云上部署后要重新進行一輪測試,如果后面考慮還云廠商,可能相同的測試還要再進行一次(比如更換了數(shù)據(jù)存儲組件),費時費力。
總結(jié)以上列舉的所有場景,他們存在的一個共同的問題是:沒有一種既能夠屏蔽操作系統(tǒng)差異,又能夠以不降低性能的方式來運行應(yīng)用的技術(shù),來解決環(huán)境依賴的問題。Docker應(yīng)運而生。
2. Docker是什么

Namespace和CGroup技術(shù)實現(xiàn)環(huán)境隔離和資源控制,其中Namespace是Linux提供的一種內(nèi)核級別環(huán)境隔離的方法,能使一個進程和該進程創(chuàng)建的子進程的運行空間都與Linux的超級父進程相隔離,注意Namespace只能實現(xiàn)運行空間的隔離,物理資源還是所有進程共用的,為了實現(xiàn)資源隔離,Linux系統(tǒng)提供了CGroup技術(shù)來控制一個進程組群可使用的資源(如CPU、內(nèi)存、磁盤IO等),把這兩種技術(shù)結(jié)合起來,就能構(gòu)造一個用戶空間獨立且限定了資源的對象,這樣的對象稱為容器。Linux Container是Linux系統(tǒng)提供的容器化技術(shù),簡稱LXC,它結(jié)合Namespace和CGroup技術(shù)為用戶提供了更易用的接口來實現(xiàn)容器化。LXC僅為一種輕量級的容器化技術(shù),它僅能對部分資源進行限制,無法做到諸如網(wǎng)絡(luò)限制、磁盤空間占用限制等。dotCloud公司結(jié)合LXC和以下列出的技術(shù)實現(xiàn)了Docker容器引擎,相比于LXC,Docker具備更加全面的資源控制能力,是一種應(yīng)用級別的容器引擎。
Chroot:該技術(shù)能在container里構(gòu)造完整的Linux文件系統(tǒng); Veth:該技術(shù)能夠在主機上虛擬出一張網(wǎng)卡與container里的eth0網(wǎng)卡進行橋接,實現(xiàn)容器與主機、容器之間的網(wǎng)絡(luò)通信; UnionFS:聯(lián)合文件系統(tǒng),Docker利用該技術(shù)“Copy on Write”的特點實現(xiàn)容器的快速啟動和極少的資源占用,后面會專門介紹該文件系統(tǒng); Iptables/netfilter:通過這兩個技術(shù)實現(xiàn)控制container網(wǎng)絡(luò)訪問策略; TC:該技術(shù)主要用來做流量隔離,限制帶寬; Quota:該技術(shù)用來限制磁盤讀寫空間的大??; Setrlimit:該技術(shù)用來限制container中打開的進程數(shù),限制打開的文件個數(shù)等
也正是因為Docker依賴Linux內(nèi)核的這些技術(shù),至少使用3.8或更高版本的內(nèi)核才能運行Docker容器,官方建議使用3.10以上的內(nèi)核版本。
3. 與傳統(tǒng)虛擬化技術(shù)的區(qū)別

4. Docker基本概念

Docker主要有如下幾個概念:
引擎:創(chuàng)建和管理容器的工具,通過讀取鏡像來生成容器,并負(fù)責(zé)從倉庫拉取鏡像或提交鏡像到倉庫中; 鏡像:類似于虛擬機鏡像,一般由一個基本操作系統(tǒng)環(huán)境和多個應(yīng)用程序打包而成,是創(chuàng)建容器的模板; 容器:可看作一個簡易版的Linxu系統(tǒng)環(huán)境(包括root用戶權(quán)限、進程空間、用戶空間和網(wǎng)絡(luò)空間等)以及運行在其中的應(yīng)用程序打包而成的盒子; 倉庫:集中存放鏡像文件的場所,分為公共倉庫和私有倉庫,目前最大的公共倉庫是官方提供的Docker Hub,此外國內(nèi)的阿里云、騰訊云等也提供了公共倉庫; 宿主機:運行引擎的操作系統(tǒng)所在服務(wù)器。
5. Docker與虛擬機、Git、JVM的類比
為了讓大家對Docker有更直觀的認(rèn)識,下面分別進行三組類比:


Docker的倉庫思想與Git是相同的。

當(dāng)然,正如Java中如果應(yīng)用代碼使用了JDK10的新特性,基于JDK8就無法運行一樣,如果容器內(nèi)的應(yīng)用使用了4.18版本的內(nèi)核特性,那么在CentOS7(內(nèi)核版本為3.10)啟動容器時,雖然容器能夠啟動,但里面應(yīng)用的功能是無法正常運行的,除非把宿主機的操作系統(tǒng)內(nèi)核升級到4.18版本。
6. Docker鏡像文件系統(tǒng)

UnionFS可以把多個物理位置獨立的目錄(也叫分支)內(nèi)容聯(lián)合掛載到同一個目錄下,UnionFS允許控制這些目錄的讀寫權(quán)限,此外對于只讀的文件和目錄,它具有“Copy on Write(寫實復(fù)制)”的特點,即如果對一個只讀的文件進行修改,在修改前會先把文件復(fù)制一份到可寫層(可能是磁盤里的一個目錄),所有的修改操作其實都是對這個文件副本進行修改,原來的只讀文件并不會變化。其中一個使用UnionFS的例子是:Knoppix,一個用于Linux演示、光盤教學(xué)和商業(yè)產(chǎn)品演示的Linux發(fā)行版,它就是把一個CD/DVD和一個存在在可讀寫設(shè)備(例如U盤)聯(lián)合掛載,這樣在演示過程中任何對CD/DVD上文件的改動都會在被應(yīng)用在U盤上,不改變原來的CD/DVD上的內(nèi)容。
UnionFS有很多種,其中Docker中常用的是AUFS,這是UnionFS的升級版,除此之外還有DeviceMapper、Overlay2、ZFS和 VFS等。Docker鏡像的每一層默認(rèn)存放在/var/lib/docker/aufs/diff目錄中,當(dāng)用戶啟動一個容器時,Docker引擎首先在/var/lib/docker/aufs/diff中新建一個可讀寫層目錄,然后使用UnionFS把該可讀寫層目錄和指定鏡像的各層目錄聯(lián)合掛載到/var/lib/docker/aufs/mnt里的一個目錄中(其中指定鏡像的各層目錄都以只讀方式掛載),通過LXC等技術(shù)進行環(huán)境隔離和資源控制,使容器里的應(yīng)用僅依賴mnt目錄中對應(yīng)的掛載目錄和文件運行起來。
利用UnionFS寫實復(fù)制的特點,在啟動一個容器時, Docker引擎實際上只是增加了一個可寫層和構(gòu)造了一個Linux容器,這兩者都幾乎不消耗系統(tǒng)資源,因此Docker容器能夠做到秒級啟動,一臺服務(wù)器上能夠啟動上千個Docker容器,而傳統(tǒng)虛擬機在一臺服務(wù)器上啟動幾十個就已經(jīng)非常吃力了,而且虛擬機啟動很慢,這是Docker相比于傳統(tǒng)虛擬機的兩個巨大的優(yōu)勢。
當(dāng)應(yīng)用只是直接調(diào)用了內(nèi)核功能來運作的情況下,應(yīng)用本身就能直接作為最底層的層來構(gòu)建鏡像,但因為容器本身會隔絕環(huán)境,因此容器內(nèi)部是無法訪問宿主機里文件的(除非指定了某些目錄或文件映射到容器內(nèi)),這種情況下應(yīng)用代碼就只能使用內(nèi)核的功能。但是Linux內(nèi)核僅提供了進程管理、內(nèi)存管理、文件系統(tǒng)管理等一些基礎(chǔ)且底層的管理功能,在實際的場景中,幾乎所有軟件都是基于操作系統(tǒng)來開發(fā)的,因此往往都需要依賴操作系統(tǒng)的軟件和運行庫等,如果這些應(yīng)用的下一層直接是內(nèi)核,那么應(yīng)用將無法運行。所以實際上應(yīng)用鏡像往往底層都是基于一個操作系統(tǒng)鏡像來補足運行依賴的。
Docker中的操作系統(tǒng)鏡像,與平常安裝系統(tǒng)時用的ISO鏡像不同。ISO鏡像里包含了操作系統(tǒng)內(nèi)核及該發(fā)行版系統(tǒng)包含的所有目錄和軟件,而Docker中的操作系統(tǒng)鏡像,不包含系統(tǒng)內(nèi)核,僅包含系統(tǒng)必備的一些目錄(如/etc /proc等)和常用的軟件和運行庫等,可把操作系統(tǒng)鏡像看作內(nèi)核之上的一個應(yīng)用,一個封裝了內(nèi)核功能,并為用戶編寫的應(yīng)用提供運行環(huán)境的工具。應(yīng)用基于這樣的鏡像構(gòu)建,就能夠利用上相應(yīng)操作系統(tǒng)的各種軟件的功能和運行庫,此外,由于應(yīng)用是基于操作系統(tǒng)鏡像來構(gòu)建的,就算換到另外的服務(wù)器,只要操作系統(tǒng)鏡像中被應(yīng)用使用到的功能能適配宿主機的內(nèi)核,應(yīng)用就能正常運行,這就是一次構(gòu)建到處運行的原因。
下圖形象的表現(xiàn)出了鏡像和容器的關(guān)系:


7. Docker基礎(chǔ)操作系統(tǒng)

以上系統(tǒng)鏡像分別適用于不同的場景:
BusyBox:一個極簡版的Linux系統(tǒng),集成了100多種常用Linux命令,大小不到2MB,被稱為“Linux系統(tǒng)的瑞士軍刀”,適用于簡單測試場景; Alpine:一個面向安全的輕型Linux發(fā)行版系統(tǒng),比BusyBox功能更完善,大小不到5MB,是官網(wǎng)推薦的基礎(chǔ)鏡像,由于其包含了足夠的基礎(chǔ)功能和體積較小,在生產(chǎn)環(huán)境中最常用; Debian/Ubuntu:Debian系列操作系統(tǒng),功能完善,大小約170MB,適合研發(fā)環(huán)境; CentOS/Fedora:都是基于Redhat的Linux發(fā)行版,企業(yè)級服務(wù)器常用操作系統(tǒng),穩(wěn)定性高,大小約200MB,適合生產(chǎn)環(huán)境使用。
8. Docker持久化存儲
根據(jù)前面介紹的容器UnionFS寫實復(fù)制的特點,可知在容器里增加、刪除或修改文件,其實都是對可寫層里的文件副本進行了操作。在容器關(guān)閉后,該可寫層也會被刪除,對容器的所有修改都會失效,因此需要解決容器內(nèi)文件持久化的問題。Docker提供了兩種方案來實現(xiàn):
把宿主機文件系統(tǒng)里的目錄映射到容器內(nèi)的目錄, 如下圖所示。如此一來,容器內(nèi)在該目錄里創(chuàng)建的所有文件,都存儲到宿主機的對應(yīng)目錄中,在關(guān)閉容器后,宿主機的目錄依然存在,再次啟動容器時還能讀取到之前創(chuàng)建的文件,因此實現(xiàn)了容器的文件持久化。當(dāng)然同時要明白,如果是對鏡像自帶文件進行了修改,由于鏡像是只讀的,該修改操作無法在關(guān)閉容器時保存下來,除非在修改了文件后構(gòu)建一個新的鏡像。

把多臺宿主機的磁盤目錄通過網(wǎng)絡(luò)聯(lián)合為共享存儲,然后把共享存儲中的特定目錄映射給特定的容器, 如下圖所示。這樣容器在重啟時,還是能讀取到關(guān)閉前創(chuàng)建的文件。生產(chǎn)環(huán)境中常用NFS作為共享存儲方案。

9. Docker鏡像制作方法
鏡像制作方法有兩種:
通過正在運行的容器生成新鏡像

這種方式比較簡單,但無法直觀的設(shè)置環(huán)境變量、監(jiān)聽端口等內(nèi)容,適合在簡單使用的場景運用。
通過Dockerfile文件來生成新鏡像

FROM ubuntu/14.04 # 基礎(chǔ)鏡像
MAINTAINER guest # 制作者簽名
RUN apt-get install openssh-server -y # 安裝ssh服務(wù)
RUN mkdir /var/run/sshd # 創(chuàng)建目錄
RUN useradd -s /bin/bash -m -d /home/guest guest # 創(chuàng)建用戶
RUN echo ‘guest:123456’| chpasswd # 修改用戶密碼
ENV RUNNABLE_USER_DIR /home/guest # 設(shè)置環(huán)境變量
EXPOSE 22 # 容器內(nèi)默認(rèn)開啟的端口
CMD ["/usr/sbin/sshd -D"] # 啟動容器時自動啟動ssh服務(wù)
Docker引擎可以根據(jù)以上Dockerfile定義的步驟,構(gòu)造出一個帶有ssh服務(wù)的Ubuntu鏡像。
10. Docker的使用場景
Docker作為一種輕量級的虛擬化方案,應(yīng)用場景十分豐富,下面收集了一些常見的場景:
作為輕量級虛擬機使用 可以使用Ubuntu等系統(tǒng)鏡像創(chuàng)建容器,當(dāng)作虛擬機來使用,相比于傳統(tǒng)虛擬機,啟動速度更快,資源占用更少,單機可以啟動大量的操作系統(tǒng)容器,方便進行各種測試; 作為云主機使用 結(jié)合Kubernetes這樣的容器管理系統(tǒng),可以在大量服務(wù)器上動態(tài)分配和管理容器,在公司內(nèi)部,甚至可以取代VMWare這樣的虛擬機管理平臺,使用Docker容器作為云主機使用; 應(yīng)用服務(wù)打包 在Web應(yīng)用服務(wù)開發(fā)場景,可以把Java運行環(huán)境、Tomcat服務(wù)器打包為一個基礎(chǔ)鏡像,在修改了代碼包后加入到基礎(chǔ)鏡像來構(gòu)建一個新的鏡像,能很方便的升級服務(wù)和控制版本; 容器云平臺CaaS Docker的出現(xiàn),使得很多云平臺供應(yīng)商開始提供容器云的服務(wù),簡稱容器即服務(wù)CaaS,以下對比一下IaaS、PaaS和SaaS: IaaS(基礎(chǔ)設(shè)施即服務(wù)):提供虛擬機或者其他基礎(chǔ)資源作為服務(wù)提供給用戶。用戶可以從供應(yīng)商那里獲得虛擬機或者存儲等資源來裝載相關(guān)的應(yīng)用,同時這些基礎(chǔ)設(shè)施的繁瑣的管理工作將由IaaS供應(yīng)商來處理。其主要的用戶是企業(yè)的系統(tǒng)管理員和運維人員; 持續(xù)集成和持續(xù)部署 互聯(lián)網(wǎng)行業(yè)提倡敏捷開發(fā),持續(xù)集成部署CI/CD便是最典型的開發(fā)模式。使用Docker容器云平臺,就能實現(xiàn)從代碼編寫完成推送到Git/SVN后,自動觸發(fā)后端CaaS平臺將代碼下載、編譯并構(gòu)建成測試Docker鏡像,再替換測試環(huán)境容器服務(wù),自動在Jenkins或者Hudson中運行單元/集成測試,測試通過后,馬上就能自動將新版本鏡像更新到線上,完成服務(wù)升級。整個過程全自動化,一氣呵成,最大程度地簡化了運維,而且保證線上、線下環(huán)境完全一致,而且線上服務(wù)版本與Git/SVN發(fā)布分支也實現(xiàn)統(tǒng)一。 解決微服務(wù)架構(gòu)的實施難題 基于Spring Cloud這樣的微服務(wù)框架,能夠?qū)崿F(xiàn)微服務(wù)的管理,但微服務(wù)本身還是需要運行在操作系統(tǒng)上。一個采用微服務(wù)架構(gòu)開發(fā)的應(yīng)用中,微服務(wù)的個數(shù)往往很多,這就導(dǎo)致了一臺服務(wù)器上往往需要啟動多個微服務(wù)來提高資源的利用率,而微服務(wù)本身可能就只能兼容部分操作系統(tǒng),這就導(dǎo)致了就算有大量的服務(wù)器資源(操作系統(tǒng)可能不一樣),但由于微服務(wù)本身與操作系統(tǒng)可能相關(guān),就不能做到讓微服務(wù)在任意服務(wù)器上運行,這就帶來了資源的浪費和運維的困難。利用Docker容器的環(huán)境隔離能力,讓微服務(wù)運行在容器內(nèi),就能夠解決以上所說的問題。 執(zhí)行臨時任務(wù) 有時候用戶只是想執(zhí)行一次性的任務(wù),但如果用傳統(tǒng)虛擬機的方式就要搭建環(huán)境,執(zhí)行完任務(wù)后還要釋放資源,比較麻煩。使用Docker容器就可以構(gòu)建臨時的運行環(huán)境,執(zhí)行完任務(wù)后關(guān)閉容器即可,方便快捷。 多租戶環(huán)境 利用Docker的環(huán)境隔離能力,可以為不同的租戶提供獨占的容器,實現(xiàn)簡單而且成本較低。
11. 總結(jié)
Docker的技術(shù)并不神秘,只是整合了前人積累的各種成果實現(xiàn)的應(yīng)用級的容器化技術(shù),它利用各種Linux發(fā)行版中使用了版本兼容的內(nèi)核容器化技術(shù),來實現(xiàn)鏡像一次構(gòu)建到處運行的效果,并且利用了容器內(nèi)的基礎(chǔ)操作系統(tǒng)鏡像層,屏蔽了實際運行環(huán)境的操作系統(tǒng)差異,使用戶在開發(fā)應(yīng)用程序時,只需確保在選定的操作系統(tǒng)和內(nèi)核版本上能正確運行即可,幾乎不需要關(guān)心實際的運行環(huán)境的系統(tǒng)差異,大大提高效率和兼容性。
但隨著容器運行得越來越多,容器管理將會稱為另一個運維的難題,這時候就需要引入Kubernetes、Mesos或Swarm這些容器管理系統(tǒng),后面有機會再介紹這些技術(shù)。
最后,關(guān)注公眾號Java技術(shù)棧,在后臺回復(fù):面試,可以獲取我整理的 Java 系列面試題和答案,非常齊全。






關(guān)注Java技術(shù)??锤喔韶?/strong>


