日韩mv欧美mv国产精品,国产一级电影在线播放,黄片网站链接,久热中文在线观看精品视频,国产—a毛—a毛A免费,黄色A片网站入口,久久九九99,红桃视频一区二区三区免费观看

先說大致的結(jié)論（完整結(jié)論在文末）：

在語義相同，有索引的情況下：group by和distinct都能使用索引，效率相同。
在語義相同，無索引的情況下：distinct效率高于group by。原因是distinct 和 group by都會進(jìn)行分組操作，但group by可能會進(jìn)行排序，觸發(fā)filesort，導(dǎo)致sql執(zhí)行效率低下。

基于這個結(jié)論，你可能會問：

為什么在語義相同，有索引的情況下，group by和distinct效率相同？
在什么情況下，group by會進(jìn)行排序操作？

帶著這兩個問題找答案。接下來，我們先來看一下distinct和group by的基礎(chǔ)使用。

distinct的使用

distinct用法

SELECT DISTINCT columns FROM table_name WHERE where_conditions;

例如：

mysql> select distinct age from student;
+------+
| age |
+------+
| 10 |
| 12 |
| 11 |
| NULL |
+------+
4 rows in set (0.01 sec)

DISTINCT 關(guān)鍵詞用于返回唯一不同的值。放在查詢語句中的第一個字段前使用，且作用于主句所有列。

如果列具有NULL值，并且對該列使用DISTINCT子句，MySQL將保留一個NULL值，并刪除其它的NULL值，因為DISTINCT子句將所有NULL值視為相同的值。

distinct多列去重

distinct多列的去重，則是根據(jù)指定的去重的列信息來進(jìn)行，即只有所有指定的列信息都相同，才會被認(rèn)為是重復(fù)的信息。

SELECT DISTINCT column1,column2 FROM table_name WHERE where_conditions;

mysql> select distinct sex,age from student;
+--------+------+
| sex | age |
+--------+------+
| male | 10 |
| female |   12 |
| male | 11 |
| male | NULL |
| female | 11 |
+--------+------+
5 rows in set (0.02 sec)

group by的使用

對于基礎(chǔ)去重來說，group by的使用和distinct類似:

單列去重

語法：

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

執(zhí)行：

mysql> select age from student group by age;
+------+
| age |
+------+
| 10 |
| 12 |
| 11 |
| NULL |
+------+
4 rows in set (0.02 sec)

多列去重

語法：

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

執(zhí)行：

mysql> select sex,age from student group by sex,age;
+--------+------+
| sex | age |
+--------+------+
| male | 10 |
| female |   12 |
| male | 11 |
| male | NULL |
| female | 11 |
+--------+------+
5 rows in set (0.03 sec)

區(qū)別示例

兩者的語法區(qū)別在于，group by可以進(jìn)行單列去重，group by的原理是先對結(jié)果進(jìn)行分組排序，然后返回每組中的第一條數(shù)據(jù)。且是根據(jù)group by的后接字段進(jìn)行去重的。

例如：

mysql> select sex,age from student group by sex;
+--------+-----+
| sex | age |
+--------+-----+
| male | 10 |
| female | 12 |
+--------+-----+
2 rows in set (0.03 sec)

distinct和group by原理

在大多數(shù)例子中，DISTINCT可以被看作是特殊的GROUP BY，它們的實現(xiàn)都基于分組操作，且都可以通過松散索引掃描、緊湊索引掃描(關(guān)于索引掃描的內(nèi)容會在其他文章中詳細(xì)介紹，就不在此細(xì)致介紹了)來實現(xiàn)。

DISTINCT和GROUP BY都是可以使用索引進(jìn)行掃描搜索的。例如以下兩條sql（只單單看表格最后extra的內(nèi)容），我們對這兩條sql進(jìn)行分析，可以看到，在extra中，這兩條sql都使用了緊湊索引掃描Using index for group-by。

所以，在一般情況下，對于相同語義的DISTINCT和GROUP BY語句，我們可以對其使用相同的索引優(yōu)化手段來進(jìn)行優(yōu)化。

mysql> explain select int1_index from test_distinct_groupby group by int1_index;
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
|  1 | SIMPLE | test_distinct_groupby | NULL | range | index_1 | index_1 | 5 | NULL | 955 |   100.00 | Using index for group-by |
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
1 row in set (0.05 sec)

mysql> explain select distinct int1_index from test_distinct_groupby;
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
|  1 | SIMPLE | test_distinct_groupby | NULL | range | index_1 | index_1 | 5 | NULL | 955 |   100.00 | Using index for group-by |
+----+-------------+-----------------------+------------+-------+---------------+---------+---------+------+------+----------+--------------------------+
1 row in set (0.05 sec)

但對于GROUP BY來說，在MYSQL8.0之前，GROUP Y默認(rèn)會依據(jù)字段進(jìn)行隱式排序。

可以看到，下面這條sql語句在使用了臨時表的同時，還進(jìn)行了filesort。

mysql> explain select int6_bigger_random from test_distinct_groupby GROUP BY int6_bigger_random;
+----+-------------+-----------------------+------------+------+---------------+------+---------+------+-------+----------+---------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-----------------------+------------+------+---------------+------+---------+------+-------+----------+---------------------------------+
|  1 | SIMPLE | test_distinct_groupby | NULL | ALL | NULL | NULL | NULL | NULL | 97402 |   100.00 | Using temporary; Using filesort |
+----+-------------+-----------------------+------------+------+---------------+------+---------+------+-------+----------+---------------------------------+
1 row in set (0.04 sec)

隱式排序

對于隱式排序，我們可以參考Mysql官方的解釋：

https://dev.mysql.com/doc/refman/5.7/en/order-by-optimization.html

大致解釋一下：

GROUP BY 默認(rèn)隱式排序（指在 GROUP BY 列沒有 ASC 或 DESC 指示符的情況下也會進(jìn)行排序）。然而，GROUP BY進(jìn)行顯式或隱式排序已經(jīng)過時（deprecated）了，要生成給定的排序順序，請?zhí)峁?ORDER BY 子句。

所以，在Mysql8.0之前,Group by會默認(rèn)根據(jù)作用字段（Group by的后接字段）對結(jié)果進(jìn)行排序。在能利用索引的情況下，Group by不需要額外進(jìn)行排序操作；但當(dāng)無法利用索引排序時，Mysql優(yōu)化器就不得不選擇通過使用臨時表然后再排序的方式來實現(xiàn)GROUP BY了。

且當(dāng)結(jié)果集的大小超出系統(tǒng)設(shè)置臨時表大小時，Mysql會將臨時表數(shù)據(jù)copy到磁盤上面再進(jìn)行操作，語句的執(zhí)行效率會變得極低。這也是Mysql選擇將此操作（隱式排序）棄用的原因。

基于上述原因，Mysql在8.0時，對此進(jìn)行了優(yōu)化更新：

https://dev.mysql.com/doc/refman/8.0/en/order-by-optimization.html

大致解釋一下：

從前（Mysql5.7版本之前），Group by會根據(jù)確定的條件進(jìn)行隱式排序。在mysql 8.0中，已經(jīng)移除了這個功能，所以不再需要通過添加order by null 來禁止隱式排序了，但是，查詢結(jié)果可能與以前的 MySQL 版本不同。要生成給定順序的結(jié)果，請按通過ORDER BY指定需要進(jìn)行排序的字段。

因此，我們的結(jié)論也出來了：

在語義相同，有索引的情況下：

group by和distinct都能使用索引，效率相同。因為group by和distinct近乎等價，distinct可以被看做是特殊的group by。

在語義相同，無索引的情況下：

distinct效率高于group by。原因是distinct 和 group by都會進(jìn)行分組操作，但group by在Mysql8.0之前會進(jìn)行隱式排序，導(dǎo)致觸發(fā)filesort，sql執(zhí)行效率低下。

但從Mysql8.0開始，Mysql就刪除了隱式排序，所以，此時在語義相同，無索引的情況下，group by和distinct的執(zhí)行效率也是近乎等價的。

推薦group by的原因

group by語義更為清晰
group by可對數(shù)據(jù)進(jìn)行更為復(fù)雜的一些處理

相比于distinct來說，group by的語義明確。且由于distinct關(guān)鍵字會對所有字段生效，在進(jìn)行復(fù)合業(yè)務(wù)處理時，group by的使用靈活性更高，group by能根據(jù)分組情況，對數(shù)據(jù)進(jìn)行更為復(fù)雜的處理，例如通過having對數(shù)據(jù)進(jìn)行過濾，或通過聚合函數(shù)對數(shù)據(jù)進(jìn)行運(yùn)算。

來源：https://blog.csdn.net/weixin_42615847/article/details/118342524

京東一面：MySQL 中的 distinct 和 group by 哪個效率更高？