我手头有一组数据,其中有些异常值,已经被替换成了-1值。
我需要新生成一列,列中注明每行数据中,那几列的数值是异常的。。具体代码该怎么写呢?
数据大致情况如下:(我需要在remark列的每一行中,注明当前行的那几列数据有异常)
我的代码段如下:
def remark(x):
for a in data.columns:
outrange =[]
if x[a] == -1:
outrange.append(a) #当前行如有多列数值异常,全部纳入列表中
return '%s outrange'%(','.join(outrange)) #输出时,用逗号将列表中的元素连接起来,并转成字符串
data['remark'] = data.apply(remark,axis=1)
data
做出来的实际效果,却只能适合单列数据有异常值的情况,对于多列数据,貌似无法记录。。求指点如何改进代码。。