pandas_cut分区间操作study_Dandelion

http://blog.sina.com.cn/u/2012509935

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

pandas_cut分区间操作study

(2020-02-23 00:17:07)

标签：

ubuntu

python

pandas

分区间

分类： Python

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

"""

Created on Sat Feb 22 22:09:45 2020

@author: dandelion

"""

import pandas as pd

import os

file = os.path.join(os.getcwd(), "log.csv")

data = pd.read_csv(file, header=0, sep=",")

# 区间门限

bins = [-150, -110, -100, -90, -80, -70, -30]

# 各区间的标签

label = labels = [

"(-150,-110]",

"(-110,-100]",

"(-100,-90]",

"(-90,-80]",

"(-80,-70]",

"(-70,-30]",

]

# 分区间操作

data["rsrp_range"] = pd.cut(data["OptimalAvgRSRP"], bins=bins, labels=label, right=True)

# 新增字段查看

columns = data.columns.to_list()

print("数据表头字段清单为:\n", columns)

print("----------------------------")

# 使用聚合 groupby方式统计各区域采样点数

pdf = data.groupby(data["rsrp_range"]).agg({"rsrp_range": "count"})

# 导出区间统计结果

pdf.to_csv(os.path.join(os.getcwd(), "各区间采样点数by(groupby).csv"))

print("各区间采样点数by(groupby):\n", pdf)

print("---------------------")

# 使用pd.value_counts()方式统计各区间的采样点数

value_count = pd.value_counts(data["rsrp_range"], sort=False)

print("各区间采样点数by(value_counts:\n", value_count)

"""

#代码执行结果示例:

#--------------------

各区间采样点数by(groupby):

rsrp_range

(-150,-110] 253

(-110,-100] 14

(-100,-90] 186

(-90,-80] 73

(-80,-70] 0

(-70,-30] 0

---------------------

各区间采样点数by(value_counts:

(-150,-110] 253

(-110,-100] 14

(-100,-90] 186

(-90,-80] 73

(-80,-70] 0

(-70,-30] 0

Name: rsrp_range, dtype: int64

"""

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：ubuntu修改默认的Python版本为Python3

后一篇：通过split命令分割大文件

新浪BLOG意见反馈留言板　欢迎批评指正