1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        總結(jié):DCIC算法分析賽完整方案分享!

        共 5333字,需瀏覽 11分鐘

         ·

        2020-09-17 03:43

        ↑↑↑關(guān)注后"星標(biāo)"Datawhale
        每日干貨?&?每月組隊(duì)學(xué)習(xí),不錯(cuò)過
        ?Datawhale干貨?
        作者:阿水,北航計(jì)算機(jī)碩士,Datawhale成員

        DCIC2020

        本文將以DCIC2020道二《巡游車與網(wǎng)約車運(yùn)營特征對(duì)比》為具體內(nèi)容,講解賽題介紹、賽題理解、賽題任務(wù)解析、賽題數(shù)據(jù)介紹和賽題指標(biāo)計(jì)算。
        比賽地址:
        https://data.xm.gov.cn/opendata-competition/#/contest_explain
        本文會(huì)給出賽題二直接可以提交的代碼思路,全文閱讀需要10分鐘。


        賽題介紹

        賽題名稱:A城市巡游車與網(wǎng)約車運(yùn)營特征對(duì)比分析

        賽題說明:出租車作為城市客運(yùn)交通系統(tǒng)的重要組成部分,以高效、便捷、靈活等優(yōu)點(diǎn)深受居民青睞。出租車每天的運(yùn)營中會(huì)產(chǎn)生大量的上下車點(diǎn)位相關(guān)信息,對(duì)這些數(shù)據(jù)進(jìn)行科學(xué)合理的關(guān)聯(lián)和挖掘,對(duì)比在工作日以及休息日、節(jié)假日的出租車數(shù)據(jù)的空間分布及其動(dòng)態(tài)變化,對(duì)出租車候車泊位、管理調(diào)度和居民通勤特征的研究具有重要意義。

        • 出租車/網(wǎng)約車:上下車地點(diǎn)挖掘;

        • 出租車/網(wǎng)約車:不同日期的空間變化;

        • 出租車/網(wǎng)約車:泊車和調(diào)度問題;

        賽題任務(wù):參賽者需依據(jù)賽事方提供的出租車(包括巡游車和網(wǎng)約車)GPS和訂單數(shù)據(jù)
        • 統(tǒng)計(jì)分析方法分別對(duì)所提供的巡游車和網(wǎng)約車運(yùn)營的時(shí)間、空間分布特征進(jìn)行量化計(jì)算,包括:

          • 計(jì)算2年的每年工作日取日平均,非工作日取日平均和節(jié)假日取日平均,三種類型各自平均的時(shí)變分布變化,三種時(shí)間類型按網(wǎng)格劃分的平均空間分布(網(wǎng)格劃分顆粒度選手自選);

          • 并分別對(duì)比分析所提供的網(wǎng)約車、巡游車,計(jì)算2年每年按工作日取日平均,非工作日取日平均和節(jié)假日取日平均三種類型的日均空駛率、訂單平均運(yùn)距、訂單平均運(yùn)行時(shí)長、上下客點(diǎn)分布密度等時(shí)變特性;

        • 根據(jù)巡游車和網(wǎng)約車的時(shí)空運(yùn)營特征,并嘗試對(duì)巡游車與網(wǎng)約車的融合發(fā)展提出相關(guān)建議。在分析過程,參賽者必須用到但不局限于提供的數(shù)據(jù),可自行加入自有數(shù)據(jù)進(jìn)行參賽,但需說明自帶數(shù)據(jù)來源并保證數(shù)據(jù)合法合規(guī)使用;


        賽題思路


        通過賽題理解&數(shù)據(jù)分析,參賽選手需要回答上述問題:

        • 每年工作日取日平均,非工作日取日平均和節(jié)假日取日平均,三種情況下出租車&網(wǎng)約車:

          • 運(yùn)營時(shí)間規(guī)律:出車時(shí)間和運(yùn)行時(shí)間;

          • 空間分布規(guī)律:城市分布規(guī)律,訂單分布規(guī)律;

          • 日均空駛率:空駛里程(沒有載客)在車輛總運(yùn)行里程中所占的比例;

          • 訂單平均運(yùn)距:訂單平均距離計(jì)算;

          • 訂單平均運(yùn)行時(shí)長:訂單平時(shí)時(shí)長計(jì)算;

          • 上下客點(diǎn)分布密度:上下車位置分布;

        • 對(duì)出租車&網(wǎng)約車的調(diào)度、融合發(fā)展提出建議:

          • 如何進(jìn)行訂單調(diào)度?識(shí)別打不到車的位置;

          • 如何進(jìn)行停車場(chǎng)推薦?

          • 訂單差異性分析?


        賽題數(shù)據(jù)

        比賽數(shù)據(jù)說明(點(diǎn)擊閱讀原文即可直達(dá)):

        https://data.xm.gov.cn/opendata-competition/#/contest_explain

        賽題數(shù)據(jù)基本可以分為四類:

        • 巡游車GPS數(shù)據(jù)(2019年、2020年);

        • 巡游車訂單數(shù)據(jù)(2019年、2020年);

        • 網(wǎng)約車GPS數(shù)據(jù)(2019年、2020年);

        • 網(wǎng)約車訂單數(shù)據(jù)(2019年、2020年);

        數(shù)據(jù)字段說明如下:

        賽題任務(wù)




        城市巡游車與網(wǎng)約車運(yùn)營特征對(duì)比分析賽題,提供 2019.05.31-2019.06.09 和2020.06.18-2020.06.27 兩年共計(jì) 20 天的 A 城市網(wǎng)約車和巡游車的 GPS 數(shù)據(jù)、訂 單數(shù)據(jù),以及 A 城市路網(wǎng)矢量數(shù)據(jù),上億條數(shù)據(jù)。

        我們可以很簡(jiǎn)單計(jì)算得出運(yùn)行結(jié)果:
        • 計(jì)算巡游車日均空駛率、運(yùn)距和運(yùn)行時(shí)長;

        • 計(jì)算網(wǎng)約車日均空駛率、運(yùn)距和運(yùn)行時(shí)長;


        import pandas as pdimport numpy as npimport glob
        # 網(wǎng)約車計(jì)算def cal_wyc(df): df = df[['DEST_TIME', 'DEP_TIME', 'WAIT_MILE', 'DRIVE_MILE']].dropna()
        if df['DEST_TIME'].dtype != np.int64: df = df[df['DEST_TIME'].apply(len) == 14] df = df[df['DEST_TIME'].apply(lambda x: x.isdigit())]
        df['DEP_TIME'] = pd.to_datetime(df['DEP_TIME'], format='%Y%m%d%H%M%S') df['DEST_TIME'] = pd.to_datetime(df['DEST_TIME'], format='%Y%m%d%H%M%S')
        df = df[df['DRIVE_MILE'].apply(lambda x: '-' not in str(x) and '|' not in str(x) and '路' not in str(x))] df['DRIVE_MILE'] = df['DRIVE_MILE'].astype(float) df['WAIT_MILE'] = df['WAIT_MILE'].astype(float)
        # return df print('空駛率:', (df['WAIT_MILE'] / (df['WAIT_MILE'] + df['DRIVE_MILE'] + 0.01)).mean()) print('訂單平均距離:', df['DRIVE_MILE'].dropna().mean()) print('訂單平均時(shí)長:', ((df['DEST_TIME'] - df['DEP_TIME']).dt.seconds / 60.0).mean())
        # 巡游車計(jì)算def cal_taxi(df): df['GETON_DATE'] = pd.to_datetime(df['GETON_DATE']) df['GETOFF_DATE'] = pd.to_datetime(df['GETOFF_DATE'])
        ??? print('空駛率:', (df['NOPASS_MILE']?/?(df['NOPASS_MILE']?+ df['PASS_MILE'])).mean()) print('訂單平均距離:', df['PASS_MILE'].mean()) print('訂單平均時(shí)長:', ((df['GETOFF_DATE'] - df['GETON_DATE']).dt.seconds / 60.0).mean())


        2019年端午節(jié)數(shù)據(jù):

        INPUT_PATH = '../input/'df = taxiorder2019 = pd.concat([    pd.read_csv(INPUT_PATH + x) for x in [        'taxiOrder20190607.csv',        'taxiOrder20190608.csv',        'taxiOrder20190609.csv'    ]])cal_taxi(df)

        INPUT_PATH = '../input/'df = taxiorder2019 = pd.concat([ pd.read_csv(INPUT_PATH + x) for x in [ 'wycOrder20190607.csv', 'wycOrder20190608.csv', 'wycOrder20190609.csv' ]])cal_wyc(df)

        出租車

        空駛率:0.2997949500443629

        訂單平均距離:6.501010225346955
        訂單平均時(shí)長:13.055927380570695


        網(wǎng)約車

        空駛率:0.056048033587246776

        訂單平均距離:9.065422897306478
        訂單平均時(shí)長:111.21042580624874


        2019年工作日數(shù)據(jù):

        INPUT_PATH = '../input/'df = taxiorder2019 = pd.concat([    pd.read_csv(INPUT_PATH + x) for x in [        'taxiOrder20190531.csv',        'taxiOrder20190603.csv',        'taxiOrder20190604.csv',        'taxiOrder20190605.csv',        'taxiOrder20190606.csv'    ]])cal_taxi(df)

        INPUT_PATH = '../input/'df = taxiorder2019 = pd.concat([ pd.read_csv(INPUT_PATH + x) for x in [ 'wycOrder20190531.csv', 'wycOrder20190603.csv', 'wycOrder20190604.csv', 'wycOrder20190605.csv', 'wycOrder20190606.csv' ]])cal_wyc(df)

        出租車

        空駛率:0.28597477408680505

        訂單平均距離:6.463312988754979
        訂單平均時(shí)長:13.897280639095992


        網(wǎng)約車

        空駛率:0.0451398589440301

        訂單平均距離:8.678716893803035
        訂單平均時(shí)長:113.34003128482045


        2019年周末數(shù)據(jù):

        INPUT_PATH = '../input/'df = taxiorder2019 = pd.concat([    pd.read_csv(INPUT_PATH + x) for x in [        'taxiOrder20190601.csv',        'taxiOrder20190602.csv',    ]])cal_taxi(df)
        df = taxiorder2019 = pd.concat([ pd.read_csv(INPUT_PATH + x) for x in [ 'wycOrder20190601.csv', 'wycOrder20190602.csv', ]])cal_wyc(df)


        出租車

        空駛率:0.2871319581401905

        訂單平均距離:6.289113628823901
        訂單平均時(shí)長:13.1542066691464


        巡游車

        空駛率:0.049881413163707276

        訂單平均距離:8.514400548965787
        訂單平均時(shí)長:113.50896480737183


        需要注意2020年數(shù)據(jù)與上面計(jì)算邏輯相同,只需要修改下具體的文件名就可以完成計(jì)算。是不是很簡(jiǎn)單?


        結(jié)果提交

        算法運(yùn)行結(jié)果要固定輸出到 sftp 的/result 目錄下,結(jié)果文件taxi_result.txt,格式為 utf-8。比賽平臺(tái)最終會(huì)去取這個(gè)結(jié)果文件算出結(jié)果, 如果提交結(jié)果為非 taxi_result.txt 文件命名,或沒有提交到/result 目錄下,則不會(huì) 有分?jǐn)?shù)產(chǎn)生。算法運(yùn)行結(jié)果文件內(nèi)容中,每個(gè)字段間以英文半角豎線 “|” 符 分隔。


        評(píng)分注意事項(xiàng)如下:

        1、賽題算法模型得分占總得分 30%,即滿分 30 分。
        2、答案給出的將是區(qū)間值,在區(qū)間內(nèi)則得分,不在區(qū)間內(nèi)則不得分,選手 提交的答案分別各給出 2 年(2019、2020)*3 類時(shí)期(正常工作日,正常周 六日、端午節(jié)假日)*2 種運(yùn)營方式(網(wǎng)約車、巡游出租車)*三個(gè)指標(biāo) (daily_unloaded_rate、order_load_distance、order_load_time),共 36 個(gè)結(jié)果值。
        3、參賽隊(duì)伍提交的算法分析結(jié)果文件,平臺(tái)每隔 2 小時(shí)評(píng)分一次,如果參賽隊(duì) 伍提交的算法結(jié)果文件在同一個(gè)周期內(nèi)多次提交,則以最后一次提交的文件參與 評(píng)分。最終算法分取參賽隊(duì)伍歷史分?jǐn)?shù)最高的一次。算法模型分析結(jié)果集每日最 多提交3次。
        4、選手可登錄?
        https://data.xm.gov.cn/opendata-competition/index.html#/
        具體查看 每次算法得分結(jié)果及歷史提交明細(xì)。

        點(diǎn)擊「閱讀原文」實(shí)踐

        瀏覽 61
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            香蕉国产成人毛片 | 免费黄色视频观看 | 岳把我用嘴含进满足我广告 | 亚洲天堂免费在线观看视频 | 动漫美女被到爽流男男 | 超碰在线视| 开心五月丁香婷婷 | 国产无码操逼视频 | 免费的草逼网 | 51av视频 |