pandas 数据处理-如何对行数据中包含某字符串的数据打上标记

对某一列中包含某字符串的数据打上标记,代码如下

# 建立“newcol”列,用于标记
result_df['newcol'] = 'noname'   #建立一个新列,暂时全部列为“noname” 

#将oldcol1列和oldcol2列中包含某些字符列出来

result_df.loc[(result_df['oldcol1'].str.contains('str1|str2|str3')&(result_df['oldcol2'].str.contains('name'))), 'newcol'] = 'newstr' # “newstr”写入“newcol”列对应的行中

思路:

1、先建立一个新列”newcol”,先附一个值“noname”,目的是为符合条件的行作标记。

2、当该行中某一列或(和)几列数据中包含某字符的数据,写入标记。如果是“或”,用“|”;如果是“和”,用“&”;在第二行代码中newcol是要写入数据的列名称,“newstr”是标记名称。

   
 
 

为你推荐
Ta的个人站点

mb发布文章164篇


imcn微信公众号

分类