1. MySQL 自增ID 超大問題查詢

        共 3991字,需瀏覽 8分鐘

         ·

        2021-02-09 01:50

        作者:燕南飛Liam

        來自:https://segmentfault.com/a/1190000017268633


        引言

        小A正在balabala寫代碼呢,DBA小B突然發(fā)來了一條消息,“快看看你的用戶特定信息表T,里面的主鍵,也就是自增id,都到16億了,這才多久,在這樣下去過不了多久主鍵就要超出范圍了,插入就會失敗,balabala......”

        我記得沒有這么多,最多1k多萬,count了下,果然是1100萬。原來運維是通過 auto_increment那個值看的,就是說,表中有大量的刪除插入操作,但是我大部分情況都是更新的,怎么會這樣?



        問題排查


        這張表是一個簡單的接口服務在使用,每天大數據會統計一大批信息,然后推送給小A,小A將信息更新到數據庫中,如果是新數據就插入,舊數據就更新之前的數據,對外接口就只有查詢了。

        很快,小A就排查了一遍自己的代碼,沒有刪除的地方,也沒有主動插入、更新id的地方,怎么會這樣呢?難道是小B的原因,也不太可能,DBA那邊兒管理很多表,有問題的話早爆出來了,但問題在我這里哪里也沒頭緒。

        小A又仔細觀察了這1000多萬已有的數據,將插入時間、id作為主要觀察字段,很快,發(fā)現了個問題,每天第一條插入的數據總是比前一天多1000多萬,有時候遞增的多,有時候遞增的少,小A又將矛頭指向了DBA小B,將問題又給小B描述了一遍。

        小B問了小A,“你是是不是用了 REPLACE INTO...語句”,這是怎么回事呢,原來 REPLACE INTO...會對主鍵有影響。
        “REPLACE INTO ...”對主鍵的影響

        假設有一張表 t1:


        如果新建這張表,執(zhí)行下面的語句,最后的數據記錄如何呢?


        原來, REPLACE INTO...每次插入的時候如果唯一索引對應的數據已經存在,會刪除原數據,然后重新插入新的數據,這也就導致id會增大,但實際預期可能是更新那條數據。

        小A說:“我知道replace是這樣,所有既沒有用它”,但還是又排查了一遍,確實不是自己的問題,沒有使用 REPLACE INTO...。

        小A又雙叒叕仔細的排查了一遍,還是沒發(fā)現問題,就讓小B查下binlog日志,看看是不是有什么奇怪的地方,查了之后還是沒發(fā)現問題,確實存在跳躍的情況,但并沒有實質性的問題。

        下圖中 @1的值對應的是自增主鍵 id,用 (@2,@3)作為唯一索引:

        后來過了很久,小B給小A指了個方向,小A開始懷疑自己的插入更新語句?
        INSERT...ON DUPLICATE KEY UPDATE...了,查了許久,果然是這里除了問題。


        “INSERT ... ON DUPLICATE KEY UPDATE ...”對主鍵的影響


        這個語句跟 REPLACE INTO...類似,不過他并不會變更該條記錄的主鍵,還是上面 t1這張表,我們執(zhí)行下面的語句,執(zhí)行完結果是什么呢?


        沒錯,跟小A預想的一樣,主鍵并沒有增加,而且 name字段已經更新為想要的了,但是執(zhí)行結果有條提示,引起了小A的注意:

        No errors; 2 rows affected, taking 10.7ms

        明明更新了一條數據,為什么這里的影響記錄條數是2呢?小A,又看了下目前表中的 auto_increment:


        竟然是5`,這里本應該是4的。

        也就是說,上面的語句,會跟 REPLACE INTO...類似的會將自增ID加1,但實際記錄沒有加,這是為什么呢?

        查了資料之后,小A得知,原來,mysql主鍵自增有個參數 innodb_autoinc_lock_mode,他有三種可能只 0, 1, 2,mysql5.1之后加入的,默認值是 1,之前的版本可以看做都是 0。

        可以使用下面的語句看當前是哪種模式:


        1. select @@innodb_autoinc_lock_mode;


        小A使用的數據庫默認值也是1,當做簡單插入(可以確定插入行數)的時候,直接將auto_increment加1,而不會去鎖表,這也就提高了性能。當插入的語句類似insert into select ...這種復雜語句的時候,提前不知道插入的行數,這個時候就要要鎖表(一個名為AUTO_INC的特殊表鎖)了,這樣auto_increment才是準確的,等待語句結束的時候才釋放鎖。還有一種稱為Mixed-mode inserts的插入,比如INSERT INTO t1 (c1,c2) VALUES (1,'a'), (NULL,'b'), (5,'c'), (NULL,'d'),其中一部分明確指定了自增主鍵值,一部分未指定,還有我們這里討論的INSERT ... ON DUPLICATE KEY UPDATE ...也屬于這種,這個時候會分析語句,然后按盡可能多的情況去分配auto_incrementid,這個要怎么理解呢,我看下面這個例子:


        此時數據表下一個自增id是7:


        1. deletefrom t1 where id in (2,3,4);


        此時數據表只剩1,5,6了,自增id還是7:



        這里的自增id是多少呢?

        上面的例子執(zhí)行完之后表的下一個自增id是10,你理解對了嗎,因為最后一條執(zhí)行的是一個 Mixed-mode inserts語句,innoDB會分析語句,然后分配三個id,此時下一個id就是10了,但分配的三個id并不一定都使用。此處* @總是遲到[zongshichidao] * 多謝指出,看官方文檔理解錯了。

        模式 0的話就是不管什么情況都是加上表鎖,等語句執(zhí)行完成的時候在釋放,如果真的添加了記錄,將 auto_increment加1。

        至于模式 2,什么情況都不加 AUTO_INC鎖,存在安全問題,當 binlog格式設置為 Statement模式的時候,從庫同步的時候,執(zhí)行結果可能跟主庫不一致,問題很大。因為可能有一個復雜插入,還在執(zhí)行呢,另外一個插入就來了,恢復的時候是一條條來執(zhí)行的,就不能重現這種并發(fā)問題,導致記錄id可能對不上。

        至此,id跳躍的問題算是分析完了,由于 innodb_autoinc_lock_mode值是1, INSERT...ON DUPLICATE KEY UPDATE...是簡單的語句,預先就可以計算出影響的行數,所以不管是否更新,這里都將 auto_increment加1(多行的話大于1)。

        如果將 innodb_autoinc_lock_mode值改為 0,再次執(zhí)行 INSERT...ON DUPLICATE KEY UPDATE...的話,你會發(fā)現 auto_increment并沒有增加,因為這種模式直接加了 AUTO_INC鎖,執(zhí)行完語句的時候釋放,發(fā)現沒有增加行數的話,不會增加自增id的。
        “INSERT ... ON DUPLICATE KEY UPDATE ...”影響的行數是1為什么返回2?
        為什么會這樣呢,按理說影響行數就是1啊,看看官方文檔的說明:

        With ON DUPLICATE KEY UPDATE, the affected-rows value per row is 1 if the row is inserted as a new row, 2 if an existing row is updated, and 0 if an existing row is set to its current values

        官方明確說明了,插入影響1行,更新影響2行,0的話就是存在且更新前后值一樣。是不是很不好理解?

        其實,你要這樣想就好了,這是為了區(qū)分到底是插入了還是更新了,返回1表示插入成功,2表示更新成功。



        解決方案


        將 innodb_autoinc_lock_mode設置為0肯定可以解決問題,但這樣的話,插入的并發(fā)性可能會受很大影響,因此小A自己想著DBA也不會同意。經過考慮,目前準備了兩種較為可能的解決方案:
        修改業(yè)務邏輯
        修改業(yè)務邏輯,將 INSERT...ON DUPLICATE KEY UPDATE...語句拆開,先去查詢,然后去更新,這樣就可以保證主鍵不會不受控制的增大,但增加了復雜性,原來的一次請求可能變?yōu)閮纱?,先查詢有沒有,然后去更新。
        刪除表的自增主鍵
        刪除自增主鍵,讓唯一索引來做主鍵,這樣子基本不用做什么變動,只要確定目前的自增主鍵沒有實際的用處即可,這樣的話,插入刪除的時候可能會影響效率,但對于查詢多的情況來說,小A比較兩種之后更愿意選擇后者。



        結語


        其實 INSERT...ON DUPLICATE KEY UPDATE...這個影響行數是2的,小A很早就發(fā)現了,只是沒有保持好奇心,不以為然罷了,沒有深究其中的問題,這深究就起來會帶出來一大串新知識,挺好,看來小A還是要對外界保持好奇心,保持敏感,這樣才會有進步。

        我是岳哥,最后給大家分享我寫的SQL兩件套:《SQL基礎知識第二版》《SQL高級知識第二版》的PDF電子版。里面有各個語法的解釋、大量的實例講解和批注等等,非常通俗易懂,方便大家跟著一起來實操。


        有需要的讀者可以下載學習,在下面的公眾號「數據前線」(非本號)后臺回復關鍵字:SQL,就行

        數據前線

        ——End——

        后臺回復關鍵字:1024,獲取一份精心整理的技術干貨

        后臺回復關鍵字:進群,帶你進入高手如云的交流群。

        推薦閱讀

        瀏覽 51
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
          
          

            1. free艳丽少妇pics | 911在线无码精品秘 入口楼风 | 日韩国产精品一级片 | 国产毛片a高清日本在线 | 日本天天操 |