1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        Go:如何高效地拼接字符串

        共 3338字,需瀏覽 7分鐘

         ·

        2021-09-13 20:13

        不久前,因為一些原因,我們決定用 Go 語言對一個 Java 項目進行重構(gòu)。這個項目的業(yè)務(wù)非常簡單,在實現(xiàn)簡單業(yè)務(wù)的簡單功能時,需要將幾組短字符串按順序拼接成一個長字符串。毋庸置疑,使用 + 操作符,是常用的字符串拼接方法,這在很多編程語言中都適用,Go 也不例外。

        功能重構(gòu)很快完成了,但在代碼 review 環(huán)節(jié)時,對新語言的好奇心頻頻冒出,Go 語言中是否有其他更為高級或者靈活的方法呢?經(jīng)過一番調(diào)研嘗試,初步得出使用 strings.Builder 是性能最優(yōu)的結(jié)論,于是,決定用它替換 + 操作符,并部署到線上。

        幾個月后,該項目在原基礎(chǔ)上需求有所增加。再次面對該代碼,心情也發(fā)生了變化,使用 strings.Builder 固然可行,但它需要三行代碼,相比之下,用 + 操作符一行代碼便能實現(xiàn)。在簡潔性和高效性之間,該如何抉擇呢?Go 語言中,是否有魚和熊掌兼得的方法?

        抱著這樣的心思,我總結(jié)出 Go 語言中至少有 6 種關(guān)于字符串的拼接方式。但新問題也隨之產(chǎn)生了,為何 Go 語言支持如此多種拼接方式?每種方式的存在,其背后的原因和邏輯又是什么呢?

        讓我們先分兩種常用場景、兩種字符串長度進行對比看看。

        一、不同情景下的效率測試

        待拼接字符串長度、次數(shù)已知,可一次完成字符串拼接,測試結(jié)果如下:

        • 32 字節(jié)以下。
        • 超過 32 字節(jié),未超過 64 字節(jié)。+ 操作符發(fā)生了一次內(nèi)存分配,但效率依然很高。bytes.Buffer 高于 strings.Builder
        • 64 字節(jié)以上。+ 操作符優(yōu)勢依然明顯,strings.Join() 也不甘示弱。

        待拼接字符串長度、次數(shù)未知,需要循環(huán)追加完成拼接操作,測試結(jié)果如下:

        • 32 字節(jié)以下。+ 每次拼接都會生成新字符串,導(dǎo)致大量的字符串創(chuàng)建、替代。
        • 超過 32 字節(jié),未超過 64 字節(jié)。bytes.Buffer 發(fā)生 2 次內(nèi)存分配。
        • 64 字節(jié)以上。bytes.Buffer 優(yōu)勢已然不再, strings.Builder 一騎絕塵。不過,這似乎還不是最終的結(jié)果。
        • 大量字符串拼接,終于要使出 strings.Builder 的必殺器 Grow() 了,bytes.Buffer 也有 Grow() 方法,但似乎作用不大。

        二、原理分析

        從上面的測試結(jié)果可以看出,在不同情況下,每種拼接方式的效率都不同,為什么會這樣呢?那就得從它們的拼接原理說起。

        • + 操作符,也叫級聯(lián)符。它使用簡單、應(yīng)用廣泛。

            res := "發(fā)" + "發(fā)"

          拼接過程:
          1.編譯器將字符串轉(zhuǎn)換成字符數(shù)組后調(diào)用 runtime/string.go 的 concatstrings() 函數(shù)
          2.在函數(shù)內(nèi)遍歷字符數(shù)組,得到總長度
          3.如果字符數(shù)組總長度未超過預(yù)留 buf(32字節(jié)),使用預(yù)留,反之,生成新的字符數(shù)組,根據(jù)總長度一次性分配內(nèi)存空間
          4.將字符串逐個拷貝到新數(shù)組,并銷毀舊數(shù)組

        • += 追加操作符,與 + 操作符相同,也是通過 runtime/string.go的concatstrings() 函數(shù)實現(xiàn)拼接,區(qū)別是它通常用于循環(huán)中往字符串末尾追加,每追加一次,生成一個新的字符串替代舊的,效率極低。

            res := "發(fā)"
            res += "發(fā)"

          拼接過程:
          1.同上

        • bytes.Buffer ,在 Golang 1.10 之前,它是循環(huán)中往末尾追加效率最高的方法,尤其是當(dāng)拼接的字符串?dāng)?shù)量較大時。

             var b bytes.Buffer    // 創(chuàng)建一個 buffer
             b.WriteString("發(fā)")   // 將字符串追加到buffer上 
             b.WriteString("發(fā)")   
             b.String()            // 取出字符串并返回

          拼接過程:
          1.創(chuàng)建 []byte ,用于緩存需要拼接的字符串
          2.首次使用 WriteString() 填充字符串時,由于字節(jié)數(shù)組容量為 0 ,最少會發(fā)生 1 次內(nèi)存分配
          3.待拼接字符串長度小于 64 字節(jié),make 一個長度為字符串總長度,容量為 64 字節(jié)的新數(shù)組
          4.待拼接字符串超過 64 字節(jié)時動態(tài)擴容,按 2* 當(dāng)前容量 + 待拼接字符長度 make 新字節(jié)數(shù)組
          5.將字節(jié)數(shù)組轉(zhuǎn)換成 string 類型返回

        • strings.Builder 在 Golang 1.10 更新后,替代了byte.Buffer,成為號稱效率最高的拼接方法。

            var b strings.Builder  
            b.WriteString("發(fā)")   
            b.WriteString("發(fā)")
            b.String()

          拼接過程:
          1.創(chuàng)建 []byte,用于緩存需要拼接的字符串
          2.通過 append 將數(shù)據(jù)填充到前面創(chuàng)建的 []byte 中
          3.append 時,如果字符串超過初始容量 8 且小于 1024 字節(jié)時,按乘以 2 的容量創(chuàng)建新的字節(jié)數(shù)組,超過 1024 字節(jié)時,按 1/4 增加
          4.將老數(shù)據(jù)復(fù)制到新創(chuàng)建的字節(jié)數(shù)組中 5.追加新數(shù)據(jù)并返回

        • strings.Join() 主要適用于以指定分隔符方式連接成一個新字符串,分隔符可以為空,在字符串一次拼接操作中,性能僅次于 + 操作符。

            strings.Join([]string{"發(fā)""發(fā)"}, "")

          拼接過程:
          1.接收的是一個字符切片
          2.遍歷字符切片得到總長度,據(jù)此通過 builder.Grow 分配內(nèi)存
          3.底層使用了 strings.Builder,每使用一次 strings.Join() ,都會創(chuàng)建新的 builder 對象

        • fmt.Sprintf(),返回使用 format 格式化的參數(shù)。除了字符串拼接,函數(shù)內(nèi)還有很多格式方面的判斷,性能不高,但它可以拼接多種類型,字符串或數(shù)字等。

            fmt.Sprintf("str1 = %v,str2 = %v""發(fā)""發(fā)")

          拼接過程:
          1.創(chuàng)建對象
          2.字符串格式化操作
          3.將格式化后的字符串通過 append 方式放到[] byte 中
          4.最后將字節(jié)數(shù)組轉(zhuǎn)換成 string 返回

        三、結(jié)論

        在待拼接字符串確定,可一次完成字符串拼接的情況下,推薦使用 + 操作符,即便 strings.BuilderGrow() 方法預(yù)先擴容,其性能也是不如 + 操作符的,另外,Grow()也不可設(shè)置過大。

        在拼接字符串不確定、需要循環(huán)追加字符串時,推薦使用 strings.Builder。但在使用時,必須使用 Grow() 預(yù)先擴容,否則性能不如 strings.Join()。



        推薦閱讀


        福利

        我為大家整理了一份從入門到進階的Go學(xué)習(xí)資料禮包,包含學(xué)習(xí)建議:入門看什么,進階看什么。關(guān)注公眾號 「polarisxu」,回復(fù) ebook 獲??;還可以回復(fù)「進群」,和數(shù)萬 Gopher 交流學(xué)習(xí)。

        瀏覽 68
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            日本黄色免费网站 | 中国黄色三级 | 欧美bbw大bbbw巨大bbw | 久久午夜无码鲁丝片午夜精 | 欧美日韩精品一区二区无码视频 | 亚洲精品偷拍 | 91三级片在线观看 | 操bxx网站| japan丰满白嫩少妇 | 免费无码无遮挡永久视频 |