新婚夜被五个伴郎强h视频,久久精品五月天,爱搞网站,91国產乱老熟女,国产无遮挡裸体紧身牛仔裤,欧美成人高潮一二区在线看,亚洲国产精品网站,国内精品三级视屏

說(shuō)在前面

本節(jié)課讓學(xué)生分析和編寫(xiě)“百家姓數(shù)據(jù)分析”程序，體驗(yàn)從制定項(xiàng)目目標(biāo)、設(shè)計(jì)算法到編寫(xiě)和運(yùn)行程序的全流程，可以幫助學(xué)生初步掌握使用pandas模塊進(jìn)行數(shù)據(jù)分析的基本方法及步驟。由于需要解決的實(shí)際問(wèn)題比較復(fù)雜，教師要引導(dǎo)學(xué)生對(duì)問(wèn)題做充分分析和討論，為學(xué)生提供樣例代碼、函數(shù)說(shuō)明和“半成品”源代碼等文檔資料，鼓勵(lì)學(xué)生閱讀和運(yùn)行示例代碼，并模仿范例對(duì)新項(xiàng)目進(jìn)行簡(jiǎn)單修改和拓展。

“百家姓數(shù)據(jù)分析”程序功能相對(duì)復(fù)雜，涉及函數(shù)多，因此需要教師對(duì)pandas模塊和DataFrame對(duì)象做簡(jiǎn)單介紹和示例演示，并為示例代碼提供充分的注釋?zhuān)詭椭鷮W(xué)生順利理解示例代碼；采用小組合作學(xué)習(xí)，將問(wèn)題分解，每組同學(xué)只需完成其中一個(gè)任務(wù)，學(xué)有余力的同學(xué)可以完成多個(gè)任務(wù)。這樣既明確了基本任務(wù)，使每一位同學(xué)都參與進(jìn)來(lái)，又實(shí)現(xiàn)了分層教學(xué)的目標(biāo)。

經(jīng)典案例

利用pandas模塊處理百家姓數(shù)據(jù)

已有素材：浙江教育出版社（https://zjjy.zjcbcm.com/）提供了某地姓名數(shù)據(jù)csv文件，從中隨機(jī)抽取了1000000條姓名數(shù)據(jù)。

情境導(dǎo)入

學(xué)生活動(dòng)1

活動(dòng)1: 制定項(xiàng)目目標(biāo)。

我這里有一個(gè)包含1百萬(wàn)條姓名記錄的csv文件，請(qǐng)大家使用記事本打開(kāi)這個(gè)文件，瀏覽一下其中存儲(chǔ)的內(nèi)容，思考你可以利用這些姓名記錄挖掘出哪些有用或者有趣的信息？例如看看你的姓氏在百家姓中排名第幾位？有多少與你同名的人等。（每人至少寫(xiě)出5條）?

教師巡回觀察各組學(xué)生的討論情況，請(qǐng)學(xué)生回答問(wèn)題，并板書(shū)記錄。

教師講解

初識(shí)DataFrame對(duì)象。

教師簡(jiǎn)單介紹pandas模塊、Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)。

通過(guò)PPT展示DataFrame對(duì)象的行索引、列標(biāo)題和值等常用屬性。

運(yùn)行示例代碼，演示創(chuàng)建DataFrame對(duì)象的兩種方法，并加以簡(jiǎn)要說(shuō)明。

學(xué)生活動(dòng)2

活動(dòng)2: 拆分姓名。

已知讀取的csv文件中每行只有一個(gè)姓名，如何將其拆分成姓氏和名字兩個(gè)部分？如何判斷姓氏是否為復(fù)姓？

使用何種數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)所有人的姓氏和名字？如何構(gòu)建以姓名、姓氏和名字作為列標(biāo)題的DateFrame對(duì)象？

學(xué)生口頭回答完上述問(wèn)題后，教師加以簡(jiǎn)單總結(jié)，并要求學(xué)生模仿示例代碼中使用字典創(chuàng)建DataFrame對(duì)象的方法，完成作業(yè)1中代碼填空。

教師巡回觀察各組學(xué)生的學(xué)習(xí)和討論情況，并對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)。

請(qǐng)完成作業(yè)1的學(xué)生上交作業(yè)，并挑選其中2份作業(yè)進(jìn)行點(diǎn)評(píng)。

#!/usr/bin/python3# 文件名: 百家姓處理之拆分姓氏# 作者：巧若拙# 時(shí)間：2021-11-14
import pandas as pd
'''函數(shù)功能：讀取csv文件并拆分名字，如果是復(fù)姓，則按照復(fù)姓處理。函數(shù)名：split_name(file_name)參數(shù)表：file_name -- 存儲(chǔ)了姓名信息的csv文件。返回值：返回包含了姓氏、名字和人數(shù)列的DataFrame對(duì)象。'''def split_name(file_name):    # 定義復(fù)姓 list    fx = ['歐陽(yáng)','太史','端木','上官','司馬','東方','獨(dú)孤','南宮','萬(wàn)俟','聞人','夏侯','諸葛','尉遲','公羊',    '赫連','澹臺(tái)','皇甫','宗政','濮陽(yáng)','公冶','太叔','申屠','公孫','慕容','仲孫','鐘離','長(zhǎng)孫','宇文',    '司徒','鮮于','司空','閭丘','子車(chē)','亓官','司寇','巫馬','公西','顓孫','壤駟','公良','漆雕','樂(lè)正',    '宰父','谷梁','拓跋','夾谷','軒轅','令狐','段干','百里','呼延','東郭','南門(mén)','羊舌','微生','公戶(hù)',    '公玉','公儀','梁丘','公仲','公上','公門(mén)','公山','公堅(jiān)','左丘','公伯','西門(mén)','公祖','第五','公乘']    xm, xing, ming = [], [], [] #分別用來(lái)存儲(chǔ)姓名、姓氏和名字    with open(file_name, 'r', encoding='utf-8') as file: #打開(kāi)文件讀取數(shù)據(jù)        for name in file:  # 取姓、名，如果是復(fù)姓，則按照復(fù)姓處理            name = name.strip() #去除兩側(cè)空格和回車(chē)符            xm.append(name)  #存儲(chǔ)姓名            if name[0:2] in fx:                p = 2            else:                p = 第1空            xing.append(name[:p]) #存儲(chǔ)姓氏            第2空                 #存儲(chǔ)名字    #使用字典構(gòu)造包含了姓名、姓氏和名字列的DataFrame對(duì)象（不含標(biāo)題）    data = {第3空}    return pd.DataFrame(data)
#設(shè)置中英文字符對(duì)齊，以改善輸出格式   pd.set_option('display.unicode.ambiguous_as_wide', True)pd.set_option('display.unicode.east_asian_width', True) 
#直接讀取文件到DataFrame對(duì)象file_name = 'names2.csv' #存儲(chǔ)百家姓數(shù)據(jù)的文件df = pd.read_csv(file_name) print(df)print("#" * 50)
#讀取csv文件并拆分名字，如果是復(fù)姓，則按照復(fù)姓處理df = split_name(file_name)print(df)

學(xué)生活動(dòng)3

活動(dòng)3: 統(tǒng)計(jì)和分析數(shù)據(jù)。

閱讀參考資料，學(xué)習(xí)pandas常用函數(shù)和示例代碼；模仿示例代碼，根據(jù)注釋將作業(yè)2中代碼補(bǔ)充完整，運(yùn)行程序，并根據(jù)程序運(yùn)行結(jié)果回答如下問(wèn)題：

問(wèn)題1：輸出和你同姓的人數(shù)?

問(wèn)題2：看看你的姓氏排名第幾位?

問(wèn)題3：輸出前n個(gè)最常見(jiàn)的姓氏？

問(wèn)題4：輸出前n個(gè)最常見(jiàn)的復(fù)姓?

除此之外，你還想知道哪些信息？請(qǐng)自行編程獲取相關(guān)信息。

教師巡回觀察各組學(xué)生的學(xué)習(xí)和討論情況，并對(duì)學(xué)生進(jìn)行個(gè)別指導(dǎo)。

將全部學(xué)生分成4組，每組重點(diǎn)回答其中一個(gè)問(wèn)題；教師請(qǐng)學(xué)生代表口頭回答問(wèn)題，并運(yùn)行和點(diǎn)評(píng)其上交的代碼。

點(diǎn)評(píng)作業(yè)時(shí)，可重點(diǎn)講解groupby()函數(shù)by參數(shù)的使用方法，count()函數(shù)的作用；可展示當(dāng)不為sort_values()函數(shù)的inplace參數(shù)賦值時(shí)，代碼的正確寫(xiě)法。

#!/usr/bin/python3# 文件名: 使用pandas處理百家姓數(shù)據(jù)# 作者：巧若拙# 時(shí)間：2021-11-14
import pandas as pd
def split_name(file_name):    pass #代碼略
#設(shè)置中英文字符對(duì)齊，以改善輸出格式      pd.set_option('display.unicode.ambiguous_as_wide', True)pd.set_option('display.unicode.east_asian_width', True) #中英文字符對(duì)齊
file_name = 'names2.csv' #存儲(chǔ)百家姓數(shù)據(jù)的文件df = split_name(file_name)#讀取csv文件并拆分名字，如果是復(fù)姓，則按照復(fù)姓處理print(df)print("#" * 50)
#輸出所有和你同名的人ming = '建國(guó)'print(df[df['名字']==ming])print("#" * 50)
#問(wèn)題1：輸出和你同姓的人數(shù)?xing = '梁'print(第4空)print("#" * 50)
#按“姓氏”分組計(jì)數(shù)，根據(jù)人數(shù)排名，并增加“排名”列xing_df = df.groupby('姓氏').count()xing_df['排名'] = xing_df['名字'].rank(ascending=False)
#問(wèn)題2：看看你的姓氏排名第幾位?print(xing_df.loc[['趙','錢(qián)','孫','李']]) #輸出趙錢(qián)孫李的排名print("#" * 50)
n = 10#問(wèn)題3：輸出前n個(gè)最常見(jiàn)的姓氏?print("輸出前n個(gè)最常見(jiàn)的姓氏：")xing_df = 第5空  # 按關(guān)鍵詞“姓氏”分組計(jì)數(shù)xing_df.sort_values('姓名', ascending=False, inplace=True) #根據(jù)人數(shù)降序排序print(xing_df[:n])print("#" * 50)
#輸出前n個(gè)最常見(jiàn)的名字print("輸出前n個(gè)最常見(jiàn)的名字：")ming_df = df.groupby('名字').count() #按關(guān)鍵詞“名字”分組計(jì)數(shù)ming_df.sort_values('姓名', ascending=False, inplace=True) #根據(jù)人數(shù)降序排序print(ming_df[:n])print("#" * 50)
#問(wèn)題4：輸出前n個(gè)最常見(jiàn)的復(fù)姓?print("輸出前n個(gè)最常見(jiàn)的復(fù)姓：")xing_df = 第6空                           #挑選出所有的復(fù)姓xing_df = xing_df.groupby('姓氏').count() #按關(guān)鍵詞分組計(jì)數(shù)xing_df.sort_values('姓名', ascending=False, inplace=True) #根據(jù)人數(shù)降序排序print(xing_df[:n])print("#" * 50)
#輸出前n個(gè)最常見(jiàn)的雙名print("輸出前n個(gè)最常見(jiàn)的雙名：")ming_df = df[df['名字'].str.len()==2]     #挑選出所有的雙名ming_df = ming_df.groupby('名字').count() #按關(guān)鍵詞分組計(jì)數(shù)ming_df.sort_values('姓名', ascending=False, inplace=True) #根據(jù)人數(shù)降序排序print(ming_df[:n])