1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        Python 城市公交網(wǎng)絡分析與可視化

        共 20711字,需瀏覽 42分鐘

         ·

        2021-09-20 06:41

        一、數(shù)據(jù)查看和預處理

        數(shù)據(jù)獲取自高德地圖API,包含了天津市公交線路和站點名稱及其經(jīng)緯度數(shù)據(jù)。

        import pandas as pd

        df = pd.read_excel('site_information.xlsx')
        df.head()
        字段說明:
        • 線路名稱:公交線路的名稱
        • 上下行:0表示上行;1表示下行
        • 站序號:公交線路上行或下行依次經(jīng)過站的序號
        • 站名稱:站點名稱
        • 經(jīng)度(分):站點的經(jīng)度
        • 緯度(分):站點的緯度

        數(shù)據(jù)字段少,結構也比較簡單,下面來充分了解我們的數(shù)據(jù)和進行預處理。總的數(shù)據(jù)有 30396 條,站名稱缺失了 5 條,緯度(分)缺失了 1 條,經(jīng)度(分)缺失了 38 條,為了處理方便,直接把有缺失值的行刪除。

        經(jīng)緯度數(shù)據(jù)是7031.982、2348.1016這樣的,需要將其轉換為以度為單位。
        df2 = df1.copy()
        df2['經(jīng)度(分)'] = df1['經(jīng)度(分)'].apply(float) / 60
        df2['緯度(分)'] = df1['緯度(分)'].apply(float) / 60
        df2.head()

        處理后的數(shù)據(jù)里,共有 618 條公交線路,4851個站點數(shù)據(jù)。

        重新保存為處理后數(shù)據(jù)
        df2.to_excel("處理后數(shù)據(jù).xlsx", index=False)

        二、數(shù)據(jù)分析

        分析天津市公交站點的分布情況
        # -*- coding: UTF-8 -*-
        """
        @Author  :葉庭云
        @公眾號  :修煉Python
        @CSDN    :https://yetingyun.blog.csdn.net/
        """

        import pandas as pd
        import matplotlib.pyplot as plt
        import matplotlib as mpl
        import random

        df = pd.read_excel("處理后數(shù)據(jù).xlsx")
        x_data = df['經(jīng)度(分)']
        y_data = df['緯度(分)']
        colors = ['#FF0000''#0000CD''#00BFFF''#008000''#FF1493''#FFD700''#FF4500''#00FA9A''#191970''#9932CC']
        colors = [random.choice(colors) for i in range(len(x_data))]
        mpl.rcParams['font.family'] = 'SimHei'
        plt.style.use('ggplot')
        # 設置大小
        plt.figure(figsize=(126), dpi=200)
        # 繪制散點圖  經(jīng)度  緯度  傳進去   設置 顏色  點的大小
        plt.scatter(x_data, y_data, marker="o", s=9., c=colors)

        # 添加描述信息 x軸 y軸 標題
        plt.xlabel("經(jīng)度")
        plt.ylabel("緯度")
        plt.title("天津市公交站點分布情況")
        plt.savefig('經(jīng)緯度散點圖.png')
        plt.show()

        結果如下:

        通過 matplotlib 繪制散點圖可視化天津市公交站點的分布情況,容易看出天津市的公交熱點分布區(qū)域。為了能更形象地分析公交線路網(wǎng)絡,我們還可以將數(shù)據(jù)可視化在實際地圖上,利用 Pyecharts 的BMap。

        上滑查看更多代碼

        # -*- coding: UTF-8 -*-
        """
        @Author :葉庭云
        @公眾號 :修煉Python
        @CSDN :https://yetingyun.blog.csdn.net/
        """

        import pandas as pd
        from pyecharts.charts import BMap
        from pyecharts import options as opts
        from pyecharts.globals import CurrentConfig

        # 引用本地js資源渲染
        CurrentConfig.ONLINE_HOST = 'D:/python/pyecharts-assets-master/assets/'

        df = pd.read_excel('處理后數(shù)據(jù).xlsx', encoding='utf-8')
        df.drop_duplicates(subset='站名稱', inplace=True)
        longitude = list(df['經(jīng)度(分)'])
        latitude = list(df['緯度(分)'])
        datas = []
        a = []
        for i, j in zip(longitude, latitude):
            a.append([i, j])

        datas.append(a)
        print(datas)

        BAIDU_MAP_AK = "改成你的百度地圖AK"

        c = (
            BMap(init_opts=opts.InitOpts(width="1200px", height="800px"))
            .add_schema(
                baidu_ak=BAIDU_MAP_AK, # 申請的BAIDU_MAP_AK
                center=[117.20, 39.13], # 天津市經(jīng)緯度中心
                zoom=10,
                is_roam=True,
            )
            .add(
                "",
                type_="lines",
                is_polyline=True,
                data_pair=datas,
                linestyle_opts=opts.LineStyleOpts(opacity=0.2, width=0.5, color='red'),
                # 如果不是最新版本的話可以注釋下面的參數(shù)(效果差距不大)
                progressive=200,
                progressive_threshold=500,
            )
        )

        c.render('公交網(wǎng)絡地圖.html')


        結果如下:

        在實際地圖上可以看到,和平區(qū)、南開區(qū)公交線路網(wǎng)絡密集,交通便利。

        公交線路網(wǎng)絡中 i 節(jié)點代表第 i 條線路,其中節(jié)點 i 的度定義為與線路 i 可以經(jīng)過換乘能夠到達的線路的數(shù)目,線路網(wǎng)絡中度的大小反映了該條公交線路與其他線路的連通程度,構建算法分析公交線路網(wǎng)絡中節(jié)點度的分布。


        上滑查看更多代碼

        # -*- coding: UTF-8 -*-
        """
        @Author :葉庭云
        @公眾號 :修煉Python
        @CSDN :https://yetingyun.blog.csdn.net/
        """

        import xlrd
        import matplotlib.pyplot as plt
        import pandas as pd
        import matplotlib as mpl


        df = pd.read_excel("site_information.xlsx")
        # 用pandas的操作去重 得到每條線路的名稱
        loc = df['線路名稱'].unique()
        # 得到每一條線路名稱的列表
        line_list = list(loc)
        print(line_list)

        # 打開Excel表格
        data = xlrd.open_workbook("site_information.xlsx")
        # print(data) # <xlrd.book.Book object at 0x000001F1111C38D0> 在內存中
        # 獲取特定Sheet 索引為0 也就是第一個表
        table = data.sheets()[0] # 從零開始
        # 每條線路對應有哪些站點 字典推導式
        site_dic = {k: [] for k in line_list}
        site_list = []
        for i in range(1, table.nrows):
            # 每一行的數(shù)據(jù) 返回的是一個列表
            x = table.row_values(i)
            if x[1] == "0":
                # 上行 站點數(shù)據(jù) 每條線路對應有哪些站點 添加進列表
                site_dic[x[0]].append(x[3])
                site_list.append(x[3])
            else:
                continue
        # print(len(site_dic)) # 618條線路
        # print(len(site_list)) # 15248條站點數(shù)據(jù)
        print(f"公交網(wǎng)絡共有 {len(line_list)} 條線路") # 618條線路

        # 先初始化一個統(tǒng)計每個節(jié)點的度的列表 與線路名稱列表里的索引一一對應
        node_count = [m * 0 for m in range(len(line_list))]
        # 以每條線路為一個節(jié)點 線路名稱為鍵 值為一個列表 里面包含每條路線上行經(jīng)過的所有站點
        sites = [site for site in site_dic.values()]
        # print(sites)
        for j in range(len(sites)): # 類似冒泡法排序 比較多少趟
            for k in range(j, len(sites) - 1): # 每趟比較后 往后推一個 直到比較完 和防止越界
                if len(sites[j]) > len(sites[k + 1]):
                    for x in sites[j]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束
                else:
                    for x in sites[k + 1]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束
        # print(node_count)
        # 節(jié)點編號 與 節(jié)點的度數(shù)索引對應
        node_number = [y for y in range(len(node_count))]
        # 線性網(wǎng)絡度的最大值 175
        print(f"線路網(wǎng)絡的度的最大值為:{max(node_count)}")
        print(f"線路網(wǎng)絡的度的最小值為:{min(node_count)}")
        print(f"線路網(wǎng)絡的度的平均值為:{sum(node_count) / len(node_count)}")
        # 設置大小 圖的像素
        # 設置字體 matplotlib 不支持顯示中文 自己本地設置
        plt.figure(figsize=(10, 6), dpi=150)
        mpl.rcParams['font.family'] = 'SimHei'

        # 繪制每個節(jié)點度的分布
        plt.bar(node_number, node_count, color="purple")

        # 添加描述信息
        plt.xlabel("節(jié)點編號n")
        plt.ylabel("節(jié)點的度數(shù)K")
        plt.title("線路網(wǎng)絡中各節(jié)點的度的大小分布", fontsize=15)
        plt.savefig("線路網(wǎng)絡中各節(jié)點的度的大小.png")
        plt.show()


        結果如下:
        公交網(wǎng)絡共有 618 條線路
        線路網(wǎng)絡的度的最大值為:175
        線路網(wǎng)絡的度的最小值為:0
        線路網(wǎng)絡的度的平均值為:55.41423948220065


        上滑查看更多代碼

        import xlrd
        import matplotlib.pyplot as plt
        import pandas as pd
        import matplotlib as mpl
        import collections

        df = pd.read_excel("site_information.xlsx")
        # 用pandas的操作去重 得到每條線路的名稱
        loc = df['線路名稱'].unique()
        # 得到每一條線路名稱的列表
        line_list = list(loc)
        print(line_list)

        # 打開Excel表格
        data = xlrd.open_workbook("site_information.xlsx")
        # print(data) # <xlrd.book.Book object at 0x000001F1111C38D0> 在內存中
        # 獲取特定Sheet 索引為0 也就是第一個表
        table = data.sheets()[0] # 從零開始
        # 每條線路對應有哪些站點 字典推導式
        site_dic = {k: [] for k in line_list}
        site_list = []
        for i in range(1, table.nrows):
            # 每一行的數(shù)據(jù) 返回的是一個列表
            x = table.row_values(i)
            if x[1] == "0":
                # 上行 站點數(shù)據(jù) 每條線路對應有哪些站點 添加進列表
                site_dic[x[0]].append(x[3])
                site_list.append(x[3])
            else:
                continue
        # print(len(site_dic)) # 618條線路
        # print(len(site_list)) # 15248條站點數(shù)據(jù)
        # 先初始化一個統(tǒng)計每個節(jié)點的度的列表 與線路名稱列表里的索引一一對應
        node_count = [m * 0 for m in range(len(line_list))]
        # 以每條線路為一個節(jié)點 線路名稱為鍵 值為一個列表 里面包含每條路線上行經(jīng)過的所有站點
        sites = [site for site in site_dic.values()]
        # print(sites)
        for j in range(len(sites)): # 類似冒泡法排序 比較多少趟
            for k in range(j, len(sites) - 1): # 每趟比較后 往后推一個 直到比較完 和防止越界
                if len(sites[j]) > len(sites[k + 1]):
                    for x in sites[j]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束
                else:
                    for x in sites[k + 1]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束
        # print(node_count)
        # 節(jié)點編號 與 節(jié)點的度數(shù)索引對應
        node_number = [y for y in range(len(node_count))]
        # 線性網(wǎng)絡度的最大值 175
        # print(max(node_count))

        # 設置大小 圖的像素
        # 設置字體 matplotlib 不支持顯示中文 自己本地設置
        plt.figure(figsize=(10, 6), dpi=150)
        mpl.rcParams['font.family'] = 'SimHei'

        # 分析節(jié)點的度K的概率分布
        # 統(tǒng)計節(jié)點的度為K的 分別有多少個
        node_count = collections.Counter(node_count)
        node_count = node_count.most_common()
        # 點
        node_dic = {_k: _v for _k, _v in node_count}
        # 按鍵從小到大排序 得到一個列表 節(jié)點的度
        sort_node = sorted(node_dic)
        # 按順序得到鍵對應的值 即有相同節(jié)點的度的個數(shù)
        sort_num = [node_dic[q] for q in sort_node]
        # 概率分布中度平均值 總的度數(shù)加起來 / 個數(shù)
        # print(sum(sort_node)/len(sort_node))
        # 概率分布中最大的度值 也就個數(shù)最多那個
        print(f"概率分布中概率最大的度值為:{max(sort_num)}")

        probability = [s1 / sum(sort_num) for s1 in sort_num] # 概率分布
        print(probability)

        # 天津市公交線路節(jié)點概率分布圖像
        plt.bar(sort_node, probability, color="red")
        # 添加描述信息
        plt.xlabel("節(jié)點的度K")
        plt.ylabel("節(jié)點度為K的概率P(K)")
        plt.title("線路網(wǎng)絡中節(jié)點度的概率分布", fontsize=15)

        plt.savefig("線路網(wǎng)絡中節(jié)點度的概率分布.png")
        plt.show()


        結果如下:
        概率分布中概率最大的度值為:16

        天津市公交線路網(wǎng)絡的度分布如上圖所示,本文收集的天津市線路網(wǎng)絡共有 618 條線路組成,線路網(wǎng)絡的度的最大值為175。概率分布中概率最大的度值為16度平均值為55.41,表明天津市公交網(wǎng)絡提供的換乘機會較多,使得可達性較高。其中概率較大的度值大多集中在 7~26 之間,使得節(jié)點強度分布相對來說不夠均勻,造成天津市很多路段公交線路較少,少數(shù)路段經(jīng)過線路過于密集,造成資源的浪費。

        聚類系數(shù)是研究節(jié)點鄰居之間的連接緊密程度,因此不必考慮邊的方向。對于有向圖,將其當成無向圖來處理。網(wǎng)絡聚類系數(shù)大,表明網(wǎng)絡中節(jié)點與其附近節(jié)點之間的連接緊密度程度高,即與實際站點之間的公交線路連接密集。計算得到天津公交復雜網(wǎng)絡的聚類系數(shù)為0.091,相對其他城市較低。

        根據(jù)公式:同規(guī)模的隨機網(wǎng)絡聚集系數(shù)約為0.00044,進一步體現(xiàn)了網(wǎng)絡的小世界特性。

        Python代碼如下:


        上滑查看更多代碼

        import xlrd
        import matplotlib.pyplot as plt
        import pandas as pd
        import matplotlib as mpl


        # 讀取數(shù)據(jù)
        df = pd.read_excel("site_information.xlsx")
        # 用pandas的操作去重 得到每條線路的名稱
        loc = df['線路名稱'].drop_duplicates()
        # 得到每一條線路名稱的列表 按照Excel表里以次下去的順序
        line_list = list(loc)
        # print(line_list)

        # 打開Excel表格
        data = xlrd.open_workbook("site_information.xlsx")
        # print(data) # <xlrd.book.Book object at 0x000001F1111C38D0> 在內存中
        # 獲取特定Sheet 索引為0 也就是第一個表
        table = data.sheets()[0] # 從零開始
        # 每條線路對應有哪些站點 字典推導式
        site_dic = {k: [] for k in line_list}
        site_list = []
        for i in range(1, table.nrows):
            # 每一行的數(shù)據(jù) 返回的是一個列表
            x = table.row_values(i)
            if x[1] == "0":
                # 只取上行站點數(shù)據(jù) 每條線路對應有哪些站點 添加進列表
                site_dic[x[0]].append(x[3])
                site_list.append(x[3])
            else:
                continue
        # print(len(site_dic)) # 618條線路
        # print(len(site_list)) # 15248條站點數(shù)據(jù)
        # 先初始化一個統(tǒng)計每個節(jié)點的度的列表 與線路名稱列表里的索引一一對應
        node_count = [m * 0 for m in range(len(line_list))]
        # 以每條線路為一個節(jié)點 線路名稱為鍵 值為一個列表 里面包含每條路線上行經(jīng)過的所有站點
        sites = [site for site in site_dic.values()]
        # print(sites)
        # 統(tǒng)計各節(jié)點的度
        for j in range(len(sites) - 1): # 類似冒泡法排序 比較多少趟
            for k in range(j, len(sites) - 1): # 每趟比較后 往后推一個 直到比較完 和防止越界
                if len(sites[j]) > len(sites[k + 1]):
                    for x in sites[j]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束
                else:
                    for x in sites[k + 1]:
                        if x in sites[j] and x in sites[k + 1]: # 只要這兩條線路有公共站點 節(jié)點度數(shù)加1
                            node_count[j], node_count[k + 1] = node_count[j] + 1, node_count[k + 1] + 1
                            break   # 兩條線路對應在列表索引的值加1 這兩條線的比較結束

        # 找到該節(jié)點的鄰居節(jié)點 鄰居節(jié)點間實際的邊數(shù)
        Ei = []
        # 對每條線路進行找鄰接節(jié)點 并統(tǒng)計其鄰接節(jié)點點實際的邊數(shù)
        for a in range(len(sites)):
            neighbor = []
            if node_count[a] == 0:
                Ei.append(0)
                continue
            if node_count[a] == 1:
                Ei.append(0)
                continue
            for b in range(len(sites)):
                if a == b: # 自身 不比
                    continue
                if len(sites[a]) > len(sites[b]): # 從站點多的線路里選取站點 看是否有公共站點
                    for x in sites[a]:
                        if x in sites[a] and x in sites[b]: # 找到鄰居節(jié)點
                            neighbor.append(sites[b])
                            break
                else:
                    for x in sites[b]:
                        if x in sites[a] and x in sites[b]: # 找到鄰居節(jié)點
                            neighbor.append(sites[b])
                            break
            # 在鄰居節(jié)點中判斷這些節(jié)點的實際邊數(shù) 又類似前面的方法 判斷兩兩是否相連
            count = 0
            for c in range(len(neighbor) - 1):
                for d in range(c, len(neighbor) - 1): # 每趟比較后 往后推一個 直到比較完 和防止越界
                    try:
                        if len(sites[c]) > len(sites[d + 1]):
                            for y in sites[c]:
                                if y in sites[c] and y in sites[d + 1]: # 鄰居節(jié)點這兩個也相連
                                    count += 1
                                    break
                                else:
                                    continue
                        else:
                            for y in sites[d + 1]:
                                if y in sites[c] and y in sites[d + 1]: # 鄰居節(jié)點這兩個也相連
                                    count += 1
                                    break
                                else:
                                    continue
                    except IndexError:
                        break
            Ei.append(count)

        # 每個節(jié)點的鄰居節(jié)點間實際相連的邊數(shù)
        # print(Ei)
        # 節(jié)點編號 與 節(jié)點的度數(shù)索引對應
        node_number = [y for y in range(len(node_count))]

        # 設置字體 matplotlib 不支持顯示中文 自己本地設置
        mpl.rcParams['font.family'] = 'SimHei'
        # 設置大小 圖的像素
        plt.figure(figsize=(10, 6), dpi=150)
        # 公交線路網(wǎng)絡的聚類系數(shù)分布圖像 相鄰節(jié)點的連通程度
        Ci = []
        for m in range(len(node_number)):
            if node_count[m] == 0:
                Ci.append(0)
            elif node_count[m] == 1:
                Ci.append(0)

            else: # 2 * 該節(jié)點鄰居節(jié)點實際連接邊數(shù) / 最大邊數(shù)
                Ci.append(2 * Ei[m] / (node_count[m] * (node_count[m] - 1)))

        # 各節(jié)點鄰居節(jié)點的連通程度 計算平均聚類系數(shù)
        print("天津市公交線路網(wǎng)絡平均聚類系數(shù)為:{:.4f}".format(sum(Ci) / len(Ci)))
        plt.bar(node_number, Ci, color="blue")

        # 添加描述信息
        plt.xlabel("節(jié)點編號n")
        plt.ylabel("節(jié)點的聚類系數(shù)")
        plt.title("線路網(wǎng)絡中各節(jié)點的聚類系數(shù)分布", fontsize=15)

        plt.savefig("聚類系數(shù)分布.png")
        plt.show()


        結果如下:
        天津市公交線路網(wǎng)絡平均聚類系數(shù)為:0.0906


        公眾號后臺回復:公交網(wǎng)絡,即可領取文中用的數(shù)據(jù)和源碼


        我們的文章到此就結束啦,如果你喜歡今天的Python 實戰(zhàn)教程,請持續(xù)關注Python實用寶典。

        有任何問題,可以在公眾號后臺回復:加群,回答相應紅字驗證信息,進入互助群詢問。

        原創(chuàng)不易,希望你能在下面點個贊和在看支持我繼續(xù)創(chuàng)作,謝謝!

        點擊下方閱讀原文可獲得更好的閱讀體驗

        Python實用寶典 (pythondict.com)
        不只是一個寶典
        歡迎關注公眾號:Python實用寶典

        瀏覽 48
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            福利午夜国语一区二区 | www骚逼 | 美女靠逼| 欧美少妇视频 | 毛片电影入口 | 日本黄色视频在线看 | 天天操肥逼 | 爱操综合网 | 18禁 网站 | 靠逼免费观看 |