pandas 数据处理-如何对行数据中包含某字符串的数据打上标记
对某一列中包含某字符串的数据打上标记,代码如下
# 建立“newcol”列,用于标记 result_df['newcol'] = 'noname' #建立一个新列,暂时全部列为“noname” #将oldcol1列和oldcol2列中包含某些字符列出来 result_df.loc[(result_df['oldcol1'].str.contains('str1|str2|str3')&(result_df['oldcol2'].str.contains('name'))), 'newcol'] = 'newstr' # “newstr”写入“newcol”列对应的行中
思路:
1、先建立一个新列”newcol”,先附一个值“noname”,目的是为符合条件的行作标记。
2、当该行中某一列或(和)几列数据中包含某字符的数据,写入标记。如果是“或”,用“|”;如果是“和”,用“&”;在第二行代码中newcol是要写入数据的列名称,“newstr”是标记名称。
为你推荐