博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas 修改 DataFrame 列名
阅读量:6964 次
发布时间:2019-06-27

本文共 1977 字,大约阅读时间需要 6 分钟。

本文参考自:

原博客针对每个DataFrame.columns中的元素做相同的修改操作
拙作是对每个元素做不同操作的生搬硬套, 请大家不吝赐教

提出问题

存在一个名为datasetDataFrame

>>> dataset.columnsIndex(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',       'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',       'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',       'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],      dtype='object')

现在, 我要将其columns名字改为:

>>> new_columnsIndex(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',       'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',       'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',       'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',       'euribor3m_18', 'nr.employed_19', 'y_20'],      dtype='object')

该如何操作?

解决

一.通过DataFrame.columns类的自身属性修改:

1.无脑赋值直接修改

>>> # 先解决`new_columns`的推导问题>>> # 列表推导>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]>>> # 类型转换>>> new_columns = pd.core.indexes.base.Index(new_columns_list)>>> dataset.columns = new_columns

2.通过.map(mapper, na_action=None)函数来修改

>>> # 注:mapper 多运用 lambda 表达式>>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法>>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper()>>> # 希望大家能帮我找到方法>>> i = 0>>> def mapper(x): # 映射函数即 mapper    global i    x += '_' + str(i)    i += 1    return x>>> dataset.columns.map(mapper)

3.参考博客用到了DataFrame.columns.str对象

help(DataFrame.columns.str)翻遍了文档,

也没能找到可以被我拿来套用的方法, 想着抽时间把这段文档翻译一下

二.通过DataFrame.rename()函数来修改

1.暴力字典法(好处:可以只修改特定的列)

>>> # 此处先用字典推导法>>> new_dict = {    key:key+'_'+str(i)    for i, key in enumerate(dataset.columns)    }>>> dataset.rename(columns=new_dict, inplace=True)

2.映射修改法

>>> # 原博文依然用到了 lambda 表达式>>> # 我就再生搬硬套一次, 把上面的复制过来>>> # 蹩脚地用一个全局变量i, 和映射函数mapper()>>> i = 0>>> def mapper(x): # 映射函数即 mapper    global i    x += '_' + str(i)    i += 1    return xdataset.rename(columns=mapper, inplace=True)

稍微总结一下 : 字典推导和列表推导的使用方法很类似, 最大的区别是选择中括号还是大括号

写在最后

十分欢迎大家直接修改拙作或提出建议!!!

转载地址:http://ssbsl.baihongyu.com/

你可能感兴趣的文章
CentOS系统Nginx配置免费https证书
查看>>
在xcode调试断点不能停在代码区的终极解决方案
查看>>
卸载ORACLE 11g
查看>>
智慧农业物联网云平台方案
查看>>
sharedUserId
查看>>
Struts2获取request三种方法
查看>>
java虚拟机学习(四)类的加载过程
查看>>
计算字符串占用大小
查看>>
光纤终端指示器
查看>>
js 执行上下文
查看>>
文本编辑器ConsoleEditor_v1.2
查看>>
Java数组赋值
查看>>
apache 局域网访问
查看>>
谈谈你对Android NDK的理解
查看>>
关于更改MYECLIPSE JS 代码背景颜色
查看>>
centos7 安装Jenkins
查看>>
设计模式-观察者模式
查看>>
Modernizr:HTML5和CSS3的开发利器
查看>>
Grid Menu
查看>>
JHStatusTextView
查看>>