如何基于首次出现的下划线分割 Pandas 列为两部分

#技术教程发布时间： 2026-01-17

本文介绍如何在 pandas 中精准地按**第一个下划线 `_`** 将字符串列拆分为两个新列（如 `gender` 和 `age`），避免 `str.split()` 默认行为导致的嵌套列表或多余下划线干扰问题。

在数据清洗中，常需将类似 Male_85__and_over 这样的复合标识符按首个分隔符拆解为语义明确的字段。若直接使用 str.split('_', n=1)，虽可限制分割次数，但 .str[1:] 会返回一个包含单个字符串的列表（如 ['85__and_over']），导致结果为 list 类型而非纯字符串，影响后续分析。

✅ 正确做法是使用正则提取 str.extract()，配合捕获组精准匹配「第一个 _ 前」和「第一个 _ 后（且不包含后续 _）」的内容：

test[["gender", "age"]] = test["column_Name_pivoted"].str
.extract(r'([^_]+)_([^_]+)')

([^_]+)：匹配一个或多个非下划线字符（即首个 _ 前的所有内容）；
_：字面量下划线，作为分隔符；
([^_]+)：匹配首个 _ 后、下一个 _ 之前的所有非下划线字符（即只取第一段有效内容）。

? 注意：此正则适用于「首个 _ 后仍有至少一个非 _ 字符」的场景（如 Male_85__and_over → gender="Male", age="85"）。若需保留 _ 后全部内容（包括后续下划线），应改用：

test[["gender", "age"]] = test["column_Name_pivoted"].str.extract(r'([^_]+)_(.*)')

其中 (.*) 表示“任意字符（含 _）零次或多次”，可完整捕获 85__and_over。

? 总结：

✅ 优先用 str.extract() 替代链式 str.split().str[]，语义清晰、结果类型安全；
✅ 正则模式需根据业务逻辑选择：[^_]+（截断至下一 _）或 .*（捕获全部剩余内容）；
⚠️ 若原始数据存在无 _ 的行，str.extract() 对应位置将返回 NaN，建议提前用 test["column_Name_pivoted"].str.contains('_').all() 校验。

技术教程SEO

上一篇 : 无醇啤酒不含酒精吗蚂蚁庄园1月17日答案

下一篇 : 《完美音浪》的NS评级刚出！这款超爽动作音游会登陆NS平台吗？

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

如何基于首次出现的下划线分割 Pandas 列为两部分

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

如何基于首次出现的下划线分割 Pandas 列为两部分

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载 学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调 经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

综合素质评价模板哪里下载学生个人填写W

魂斗罗30条命秘籍怎么调经典关卡开启新