日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 知識百科

十個 Python 小技巧,覆蓋了90%的數(shù)據(jù)分析需求!

來源: 責編: 時間:2023-08-07 16:30:00 285觀看
導讀 數(shù)據(jù)分析師日常工作會涉及各種任務,比如數(shù)據(jù)預處理、數(shù)據(jù)分析、機器學習模型創(chuàng)建、模型部署。在本文中,我將分享10個 Python 操作,它們可覆蓋90%的數(shù)據(jù)分析問題。有所收獲點贊

數(shù)據(jù)分析師日常工作會涉及各種任務,比如數(shù)據(jù)預處理、數(shù)據(jù)分析、機器學習模型創(chuàng)建、模型部署。HQY28資訊網(wǎng)——每日最新資訊28at.com

在本文中,我將分享10個 Python 操作,它們可覆蓋90%的數(shù)據(jù)分析問題。有所收獲點贊、收藏、關注。HQY28資訊網(wǎng)——每日最新資訊28at.com

1、閱讀數(shù)據(jù)集HQY28資訊網(wǎng)——每日最新資訊28at.com

閱讀數(shù)據(jù)是數(shù)據(jù)分析的組成部分,了解如何從不同的文件格式讀取數(shù)據(jù)是數(shù)據(jù)分析師的第一步。下面是如何使用 pandas 讀取包含 Covid-19 數(shù)據(jù)的 csv 文件的示例。HQY28資訊網(wǎng)——每日最新資訊28at.com

import pandas as pd HQY28資訊網(wǎng)——每日最新資訊28at.com
# reading the countries_data file along with the location within read_csv function.HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df = pd.read_csv('C:/Users/anmol/Desktop/Courses/Python for Data Science/Code/countries_data.csv') HQY28資訊網(wǎng)——每日最新資訊28at.com
# showing the first 5 rows of the dataframe HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df.head()HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com

以下是 countries_df.head() 的輸出,我們可以使用它查看數(shù)據(jù)框的前 5 行:HQY28資訊網(wǎng)——每日最新資訊28at.com

HQY28資訊網(wǎng)——每日最新資訊28at.com

2、匯總統(tǒng)計HQY28資訊網(wǎng)——每日最新資訊28at.com

下一步就是通過查看數(shù)據(jù)匯總來了解數(shù)據(jù),例如 NewConfirmed、TotalConfirmed 等數(shù)字列的計數(shù)、均值、標準偏差、分位數(shù)以及國家代碼等分類列的頻率、最高出現(xiàn)值HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_df.describe()HQY28資訊網(wǎng)——每日最新資訊28at.com

使用 describe 函數(shù),我們可以得到數(shù)據(jù)集連續(xù)變量的摘要,如下所示:HQY28資訊網(wǎng)——每日最新資訊28at.com

HQY28資訊網(wǎng)——每日最新資訊28at.com

在 describe() 函數(shù)中,我們可以設置參數(shù)"include = 'all'"來獲取連續(xù)變量和分類變量的摘要HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_df.describe(include = 'all')HQY28資訊網(wǎng)——每日最新資訊28at.com

HQY28資訊網(wǎng)——每日最新資訊28at.com

3、數(shù)據(jù)選擇和過濾HQY28資訊網(wǎng)——每日最新資訊28at.com

分析其實不需要數(shù)據(jù)集的所有行和列,只需要選擇感興趣的列并根據(jù)問題過濾一些行。HQY28資訊網(wǎng)——每日最新資訊28at.com

例如,我們可以使用以下代碼選擇 Country 和 NewConfirmed 列:HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_df[['Country','NewConfirmed']]HQY28資訊網(wǎng)——每日最新資訊28at.com

我們還可以將數(shù)據(jù)過濾Country,使用 loc,我們可以根據(jù)一些值過濾列,如下所示:HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_df.loc[countries_df['Country'] == 'United States of America']HQY28資訊網(wǎng)——每日最新資訊28at.com

HQY28資訊網(wǎng)——每日最新資訊28at.com

4、聚合HQY28資訊網(wǎng)——每日最新資訊28at.com

計數(shù)、總和、均值等數(shù)據(jù)聚合,是數(shù)據(jù)分析最常執(zhí)行的任務之一。HQY28資訊網(wǎng)——每日最新資訊28at.com

我們可以使用聚合找到各國的 NewConfimed 病例總數(shù)。使用 groupby 和 agg 函數(shù)執(zhí)行聚合。HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_df.groupby(['Country']).agg({'NewConfirmed':'sum'})5、JoinHQY28資訊網(wǎng)——每日最新資訊28at.com

使用 Join 操作將 2 個數(shù)據(jù)集組合成一個數(shù)據(jù)集。HQY28資訊網(wǎng)——每日最新資訊28at.com

例如:一個數(shù)據(jù)集可能包含不同國家/地區(qū)的 Covid-19 病例數(shù),另一個數(shù)據(jù)集可能包含不同國家/地區(qū)的緯度和經(jīng)度信息。HQY28資訊網(wǎng)——每日最新資訊28at.com

現(xiàn)在我們需要結合這兩個信息,那么我們可以執(zhí)行如下所示的連接操作HQY28資訊網(wǎng)——每日最新資訊28at.com

countries_lat_lon = pd.read_excel('C:/Users/anmol/Desktop/Courses/Python for Data Science/Code/countries_lat_lon.xlsx')HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# joining the 2 dataframe : countries_df and countries_lat_lonHQY28資訊網(wǎng)——每日最新資訊28at.com
# syntax : pd.merge(left_df, right_df, on = 'on_column', how = 'type_of_join')HQY28資訊網(wǎng)——每日最新資訊28at.com
joined_df = pd.merge(countries_df, countries_lat_lon, on = 'CountryCode', how = 'inner')HQY28資訊網(wǎng)——每日最新資訊28at.com
joined_df6、內(nèi)建函數(shù)HQY28資訊網(wǎng)——每日最新資訊28at.com

了解數(shù)學內(nèi)建函數(shù),如 min()、max()、mean()、sum() 等,對于執(zhí)行不同的分析非常有幫助。HQY28資訊網(wǎng)——每日最新資訊28at.com

我們可以通過調(diào)用它們直接在數(shù)據(jù)幀上應用這些函數(shù),這些函數(shù)可以在列上或在聚合函數(shù)中獨立使用,如下所示:HQY28資訊網(wǎng)——每日最新資訊28at.com

# finding sum of NewConfirmed cases of all the countries HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df['NewConfirmed'].sum()HQY28資訊網(wǎng)——每日最新資訊28at.com
# Output : 6,631,899HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# finding the sum of NewConfirmed cases across different countries HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df.groupby(['Country']).agg({'NewConfirmed':'sum'})HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# Output HQY28資訊網(wǎng)——每日最新資訊28at.com
# NewConfirmedHQY28資訊網(wǎng)——每日最新資訊28at.com
#Country HQY28資訊網(wǎng)——每日最新資訊28at.com
#Afghanistan 75HQY28資訊網(wǎng)——每日最新資訊28at.com
#Albania 168HQY28資訊網(wǎng)——每日最新資訊28at.com
#Algeria 247HQY28資訊網(wǎng)——每日最新資訊28at.com
#Andorra 0HQY28資訊網(wǎng)——每日最新資訊28at.com
#Angola 537、用戶自定義函數(shù)HQY28資訊網(wǎng)——每日最新資訊28at.com

我們自己編寫的函數(shù)是用戶自定義函數(shù)。我們可以在需要時通過調(diào)用該函數(shù)來執(zhí)行這些函數(shù)中的代碼。例如,我們可以創(chuàng)建一個函數(shù)來添加 2 個數(shù)字,如下所示:HQY28資訊網(wǎng)——每日最新資訊28at.com

# User defined function is created using 'def' keyword, followed by function definition - 'addition()'HQY28資訊網(wǎng)——每日最新資訊28at.com
# and 2 arguments num1 and num2HQY28資訊網(wǎng)——每日最新資訊28at.com
def addition(num1, num2):HQY28資訊網(wǎng)——每日最新資訊28at.com
return num1+num2HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# calling the function using function name and providing the arguments HQY28資訊網(wǎng)——每日最新資訊28at.com
print(addition(1,2))HQY28資訊網(wǎng)——每日最新資訊28at.com
#output : 38、PivotHQY28資訊網(wǎng)——每日最新資訊28at.com

Pivot 是將一列行內(nèi)的唯一值轉(zhuǎn)換為多個新列,這是很棒的數(shù)據(jù)處理技術。HQY28資訊網(wǎng)——每日最新資訊28at.com

在 Covid-19 數(shù)據(jù)集上使用 pivot_table() 函數(shù),我們可以將國家名稱轉(zhuǎn)換為單獨的新列:HQY28資訊網(wǎng)——每日最新資訊28at.com

# using pivot_table to convert values within the Country column into individual columns and HQY28資訊網(wǎng)——每日最新資訊28at.com
# filling the values corresponding to these columns with numeric variable - NewConfimed HQY28資訊網(wǎng)——每日最新資訊28at.com
pivot_df = pd.pivot_table(countries_df, columns = 'Country', values = 'NewConfirmed')HQY28資訊網(wǎng)——每日最新資訊28at.com
pivot_df9、遍歷數(shù)據(jù)框HQY28資訊網(wǎng)——每日最新資訊28at.com

很多時候需要遍歷數(shù)據(jù)框的索引和行,我們可以使用 iterrows 函數(shù)遍歷數(shù)據(jù)框:HQY28資訊網(wǎng)——每日最新資訊28at.com

# iterating over the index and row of a dataframe using iterrows() function HQY28資訊網(wǎng)——每日最新資訊28at.com
for index, row in countries_df.iterrows():HQY28資訊網(wǎng)——每日最新資訊28at.com
print('Index is ' + str(index))HQY28資訊網(wǎng)——每日最新資訊28at.com
print('Country is '+ str(row['Country']))HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# Output : HQY28資訊網(wǎng)——每日最新資訊28at.com
# Index is 0HQY28資訊網(wǎng)——每日最新資訊28at.com
# Country is AfghanistanHQY28資訊網(wǎng)——每日最新資訊28at.com
# Index is 1HQY28資訊網(wǎng)——每日最新資訊28at.com
# Country is AlbaniaHQY28資訊網(wǎng)——每日最新資訊28at.com
# .......10、字符串操作HQY28資訊網(wǎng)——每日最新資訊28at.com

很多時候我們處理數(shù)據(jù)集中的字符串列,在這種情況下,了解一些基本的字符串操作很重要。HQY28資訊網(wǎng)——每日最新資訊28at.com

例如如何將字符串轉(zhuǎn)換為大寫、小寫以及如何找到字符串的長度。HQY28資訊網(wǎng)——每日最新資訊28at.com

# country column to upper caseHQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df['Country_upper'] = countries_df['Country'].str.upper()HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# country column to lower caseHQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df['CountryCode_lower']=countries_df['CountryCode'].str.lower()HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
# finding length of characters in the country column HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df['len'] = countries_df['Country'].str.len()HQY28資訊網(wǎng)——每日最新資訊28at.com
HQY28資訊網(wǎng)——每日最新資訊28at.com
countries_df.head()HQY28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-119-2208-0.html十個 Python 小技巧,覆蓋了90%的數(shù)據(jù)分析需求!

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 云安全日報220308:Ubuntu Redis數(shù)據(jù)庫發(fā)現(xiàn)執(zhí)行任意代碼漏洞,需要盡快升級

下一篇: 騙人還是文字強!MIT最新研究:DeepFake換臉還不如編輯動動筆

標簽:
  • 熱門焦點
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产一区二区三区日韩| 欧美激情在线免费观看| 亚洲欧美伊人| 欧美一区国产在线| 老牛影视一区二区三区| 欧美大片免费观看| 欧美三级网址| 国产区精品视频| 亚洲电影在线看| 一本色道久久综合| 性欧美videos另类喷潮| 久久久最新网址| 欧美日韩国产精品| 国产偷自视频区视频一区二区| 尤妮丝一区二区裸体视频| 亚洲美女在线国产| 香港成人在线视频| 欧美大片在线观看一区二区| 欧美日韩综合在线免费观看| 国产一二三精品| 亚洲美女网站| 久久成人国产| 欧美日韩精品一区二区三区四区| 国产日韩一区二区| 亚洲欧洲日本国产| 欧美一区91| 欧美激情综合五月色丁香| 国产精品综合网站| 日韩亚洲欧美中文三级| 羞羞漫画18久久大片| 欧美好吊妞视频| 国产一区二区三区观看| 夜夜嗨av色一区二区不卡| 久久久99精品免费观看不卡| 欧美日韩另类视频| 韩国av一区二区三区| 亚洲视频免费看| 欧美成人视屏| 国产一区二区三区久久久久久久久| 亚洲毛片在线| 狂野欧美激情性xxxx欧美| 国产精品久久久久久久久免费樱桃| 亚洲高清不卡av| 久久久国产午夜精品| 国产精品美女午夜av| 亚洲人永久免费| 国产一区二区三区的电影| 亚洲七七久久综合桃花剧情介绍| 欧美一区二区视频观看视频| 欧美日韩少妇| 亚洲国内精品在线| 久久久久久久久伊人| 国产精品网站在线观看| 一区二区三区精品视频在线观看| 美国三级日本三级久久99| 国产午夜亚洲精品不卡| 亚洲一区二区三区在线| 欧美日韩国产在线看| 亚洲精品黄网在线观看| 久久综合999| 国产在线视频欧美| 午夜伦理片一区| 国产精品美女一区二区| 亚洲桃色在线一区| 欧美日韩不卡合集视频| 亚洲国产另类久久久精品极度| 久久精品人人做人人爽| 国产欧美一区视频| 亚洲欧美日韩国产成人精品影院| 欧美视频在线观看免费| 99精品久久免费看蜜臀剧情介绍| 欧美高清在线| 亚洲人在线视频| 欧美黄污视频| 亚洲精品综合久久中文字幕| 欧美va天堂| 亚洲黄网站在线观看| 欧美成人精品福利| 亚洲韩国青草视频| 欧美高清视频一区二区| 91久久在线播放| 欧美日本一区| 夜夜爽夜夜爽精品视频| 欧美日韩久久精品| 99这里有精品| 国产精品国产福利国产秒拍| 亚洲一区免费视频| 久久riav二区三区| 国语自产在线不卡| 蜜桃久久av| 亚洲欧洲精品一区二区| 欧美暴力喷水在线| 亚洲精品一区二区三区在线观看| 欧美激情视频在线播放| 99riav国产精品| 国产精品h在线观看| 亚洲在线观看| 国产日韩欧美亚洲| 久久精品视频在线观看| 樱桃国产成人精品视频| 欧美不卡在线视频| 日韩视频在线观看一区二区| 欧美色视频日本高清在线观看| 中文无字幕一区二区三区| 国产精品爽爽ⅴa在线观看| 久久国产精品一区二区三区| 精品1区2区| 欧美精品色一区二区三区| 亚洲性人人天天夜夜摸| 国产喷白浆一区二区三区| 久久久久久穴| 亚洲精品一区二区三区福利 | 欧美日韩亚洲激情| 国产精品99久久久久久久女警 | 亚洲人成毛片在线播放| 欧美日韩在线播放三区| 午夜久久tv| 亚洲国产精品成人综合| 欧美视频免费看| 久久国产天堂福利天堂| 亚洲激情二区| 国产精品久久久久毛片大屁完整版| 久久久激情视频| 亚洲老板91色精品久久| 国产精品欧美日韩一区二区| 久久免费视频网站| 在线亚洲电影| 国产字幕视频一区二区| 欧美激情1区2区3区| 亚洲欧美视频一区| 亚洲高清不卡av| 国产精品wwwwww| 久久久久综合一区二区三区| 亚洲精品少妇30p| 国产欧美日韩一区二区三区在线 | 中文在线一区| 狠狠色狠狠色综合人人| 欧美日韩国产在线播放网站| 欧美在线播放一区二区| 亚洲精一区二区三区| 国产精品影音先锋| 欧美国产一区二区在线观看| 欧美亚洲系列| 99亚洲精品| 在线激情影院一区| 国产精品一区二区久久国产| 能在线观看的日韩av| 午夜精品久久99蜜桃的功能介绍| 亚洲国产精品t66y| 国产无一区二区| 欧美三区在线观看| 老司机久久99久久精品播放免费| 亚洲无线视频| 亚洲国产日韩欧美在线动漫| 国产欧美欧美| 欧美日韩视频第一区| 鲁大师成人一区二区三区| 午夜精品国产更新| 在线视频一区观看| 亚洲精品国精品久久99热一| 国内精品视频666| 国产精品久久一级| 欧美日本韩国| 欧美二区在线播放| 久久女同精品一区二区| 香蕉久久精品日日躁夜夜躁| 亚洲伦理一区| 亚洲高清在线观看| 国产亚洲福利一区| 国产精品美女久久久浪潮软件 | 欧美成人精品1314www| 久久国产精品久久久久久电车 | 欧美日韩国产另类不卡| 麻豆精品在线播放| 久久久久久久精| 欧美一区影院| 亚洲综合日韩在线| 中文日韩电影网站| 99国产精品| 亚洲美女区一区| 最新国产精品拍自在线播放| 悠悠资源网亚洲青| 黄色成人在线网址| 狠狠入ady亚洲精品| 国产日韩欧美视频在线| 国产精品美女久久久久aⅴ国产馆| 欧美日韩理论| 欧美日韩情趣电影| 欧美日韩一区二区三区视频| 欧美精品福利在线| 欧美成人精品在线视频| 美乳少妇欧美精品| 免费看成人av| 欧美99在线视频观看| 老鸭窝亚洲一区二区三区| 久久亚洲影音av资源网| 久久美女艺术照精彩视频福利播放| 久久国产福利国产秒拍| 欧美自拍丝袜亚洲| 久久精品女人的天堂av| 久久九九免费视频| 久久婷婷激情| 免费人成网站在线观看欧美高清| 久久尤物视频|