999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python+pandas的數(shù)據(jù)分析處理應用

2018-12-24 15:06:05何春燕王超宇成都理工大學
數(shù)碼世界 2018年7期
關鍵詞:數(shù)據(jù)處理用戶

何春燕 王超宇 成都理工大學

1.引言

Python是一種面向對象的腳本語言,自20世紀90年代初誕生到現(xiàn)在,已經(jīng)被廣泛應人工智能,機器學習,大數(shù)據(jù)等方面。python語法簡單,容易理解和上手。無論安裝還是使用python都不需要付費。python是一種面向對象的語言,同時也支持面向過程。基于它的開源的本質,python可在許多平臺上使用,包括Windows,Linux等。python有強大的標準庫和豐富的第三方庫。.

Pandas被廣泛運用于金融、統(tǒng)計以及社會科學領域的數(shù)據(jù)處理。

2.Pandas處理數(shù)據(jù)

2.1 數(shù)據(jù)導入

程序段1:

從mangoDB讀取用戶表

import pandas as pd

from pymongo import MongoClient

host = ‘0.0.0.0’# 配置 MongoDB 連接信息

port = 27019

client = MongoClient(host=host, port=port)

collenction =‘user’

cursor = db[collection].find({})

User = pd.DataFrame(list(cursor))

部分數(shù)據(jù)展示:

user_id channel

first_visit_time

2018-01-04 10:43:33 33737760 anzhishichang

2018-01-04 13:54:50 33217154 anzhishichang

2018-01-08 17:46:22 33130645 anzhishichang

2.2 數(shù)據(jù)處理

2.2.1. 獲取新增用戶

新增用戶:首次使用應用程序的用戶,以first_visit_time為依據(jù),判斷用戶是否為新增用戶。

時間序列分析在金融數(shù)據(jù)分析中占據(jù)重要位置,可傳入字符串進行索引。

例如可傳入”20180109”來獲取1月9號首次訪問應用程序的用戶數(shù)據(jù),

User[‘20180109]

user_id channel

first_visit_time

2018-01-09 15:50:44 33217151 anzhishichang

可傳入時間段獲取數(shù)據(jù):

User[“201808”:”20180111”]

user_id channel

first_visit_time

2018-01-08 17:43:11 4897182 anzhishichang

2018-01-11 09:18:59 33217153 anzhishichang

時間索引的切片操作包含尾部的數(shù)據(jù)。

2.2.2.獲取最近7天新增用戶數(shù)

程序段2:

import pandas as pd

from datetime import datetime, date, timedelta

end_date = date.today()

new_user = pd.Series(name=`新增用戶數(shù)`)

#通過for循環(huán)獲取7天的新增用戶數(shù)

for i in range(7):

dt = date.today() - timedelta(days=i)

sum_new = User[dt[-4:]]

new_user[dt] = len(sum_new)

返回結果:

0522 65

0521 36

0520 8

0519 6

0518 3

0517 41

0516 58

可清晰的看到,每天的新增用戶數(shù)。

2.2.3.獲取最近7天不同渠道的新增用戶數(shù)

程序段3:

import pandas as pd

from datetime import datetime, timedelta, date

new7channel = pd.DataFrame()

#外層for循環(huán)獲取最近7天的新增用戶數(shù)據(jù)

for i in range(7):

Dt = date.today() - timedelta(days=i)

dt1 = datetime.strftime(dt, "%Y%m%d")

data = User[dt1]

Channel = data[`channel`].drop_duplicates()

new_channel=pd.Series(name=dt1[-4:])

#內(nèi)層for循環(huán),獲取各渠道新增用戶數(shù)

for cn in channel:

dt_cn = data[data[`channel`] == cn]

num_channel[cn] = len(dt_cn)

#concat函數(shù)將數(shù)據(jù)連接起來。通過fillna函數(shù)將值為NaN數(shù)據(jù)用0填充。

new7channel=pd.concat([new7channel,new_channel],axis=1).fillna(0)

部分結果:

0523 0522 0521 0520 0519 0518 0517

AppStore 8.0 20.0 13.0 13.0 12.0 11.0 20.0

c360 0.0 2.0 2.0 0.0 0.0 0.0 1.0

橫向數(shù)據(jù)表示不同渠道最近7天的新增用戶數(shù),縱向則表明不同渠道的新增用戶數(shù)。

3 結束語

在大數(shù)據(jù)時代,數(shù)據(jù)分析的影響及重要性在不斷拓寬和加深。本文介紹了基于Python,pandas簡單的數(shù)據(jù)分析過程。

猜你喜歡
數(shù)據(jù)處理用戶
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
MATLAB在化學工程與工藝實驗數(shù)據(jù)處理中的應用
Matlab在密立根油滴實驗數(shù)據(jù)處理中的應用
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
主站蜘蛛池模板: 国产精品成人AⅤ在线一二三四| 欧美日韩国产在线人成app| 亚洲欧洲日产国码无码av喷潮| 亚洲水蜜桃久久综合网站| 狠狠色丁香婷婷综合| 九九九国产| 97av视频在线观看| 午夜a视频| 免费看美女毛片| 999福利激情视频 | 国产精品女同一区三区五区| 欧美福利在线播放| 日韩大乳视频中文字幕| 亚洲国产天堂久久九九九| 欧美中文字幕一区二区三区| 99热这里都是国产精品| 国产精品理论片| 国产在线观看成人91| 久久国产精品波多野结衣| 久久综合伊人 六十路| 色婷婷在线影院| 久久久久久久久久国产精品| 国产91全国探花系列在线播放| 热久久国产| 日韩精品亚洲精品第一页| 午夜限制老子影院888| 国产剧情一区二区| 在线免费观看AV| 广东一级毛片| 在线观看国产精品日本不卡网| a级毛片免费看| 麻豆AV网站免费进入| 91网红精品在线观看| 亚洲女同欧美在线| 久久国产高清视频| 亚洲第一精品福利| 国产不卡网| 国产午夜无码专区喷水| 国产精品手机在线观看你懂的| 在线国产欧美| 国产精品免费露脸视频| 亚洲精品欧美重口| 2020极品精品国产| 中文字幕佐山爱一区二区免费| 亚洲成人一区二区三区| 综合五月天网| 91精品国产综合久久香蕉922| 日日拍夜夜嗷嗷叫国产| 最新日本中文字幕| 精品91视频| 91亚洲精品国产自在现线| 制服丝袜一区| 国产网站免费观看| 日本免费福利视频| AV不卡国产在线观看| 免费女人18毛片a级毛片视频| 一本综合久久| 久久美女精品国产精品亚洲| 久久77777| 成人蜜桃网| 亚洲天堂.com| 国产白浆在线| 国产主播福利在线观看| 国产精品999在线| 天堂av综合网| 亚洲国产成人麻豆精品| 亚洲一区毛片| 免费亚洲成人| 亚洲成a人在线观看| 亚洲人成高清| 久久免费视频6| 久久青草热| 国产成人精品亚洲日本对白优播| 亚洲国产在一区二区三区| 亚洲AV无码久久天堂| 精品国产中文一级毛片在线看 | 国产男女免费视频| 欧美区一区| 亚洲午夜福利精品无码不卡| 国产午夜无码专区喷水| 国产精品一区不卡| 91精品啪在线观看国产91九色|