如何基于首次下划线分割 Pandas 列为两部分

#技术教程发布时间： 2026-01-17

使用 `str.extract()` 配合正则表达式可精准按第一个下划线将字符串列拆分为两个新列，避免 `str.split()` 产生的嵌套列表或多余分隔符问题。

在 Pandas 中，若需将类似 'Male_85__and_over' 的字符串仅按第一个下划线 _ 拆分为两段（即 gender = 'Male'，age = '85__and_over'），直接使用 str.split('_', n=1) 易引入列表结构（如 ['Male', '85__and_over']），而 .str[1:] 会返回 list 类型，导致列值为 [85__and_over] —— 这显然不符合结构化分析需求。

更简洁、健壮的方案是使用 str.

extract() 配合命名捕获组正则表达式：

test[["gender", "age"]] = test["column_Name_pivoted"].str.extract(r'^([^_]+)_((?:[^_]|_(?=[^_]))*)$')

但针对本例中“首下划线后剩余全部内容”的语义，推荐更清晰、通用的写法：

test[["gender", "age"]] = test["column_Name_pivoted"].str.extract(r'^([^_]+)_(.*)$')

✅ 解析说明：

^([^_]+)：从开头匹配一个或多个非下划线字符（即首个字段，如 Male）；
_：字面量下划线（仅匹配第一个）；
(.*)：贪婪匹配其后所有字符（包括后续的 _，如 85__and_over）；
^ 和 $ 确保整行匹配，提升鲁棒性。

⚠️ 注意事项：

若原列存在不含 _ 的值（如 'Unknown'），extract() 将返回 NaN，可加 .fillna() 处理；
str.split('_', n=1) 也可用 .str[0] 和 .str[1]（非 .str[1:]）提取，例如：
```
split_parts = test["column_Name_pivoted"].str.split('_', n=1, expand=True)
test["gender"] = split_parts[0]
test["age"] = split_parts[1].fillna("")  # 处理无下划线情况
```
此方式无需正则，更直观，且 expand=True 直接返回 DataFrame，推荐初学者优先尝试。

总之，str.extract() 适合需精确控制分隔逻辑的场景，而 str.split(..., expand=True) 更简洁通用——二者皆优于原始 .str[1:] 的错误用法。

技术教程SEO

上一篇 : 综合素质评价模板哪里下载学生个人填写Word模板【免费】

下一篇 : 《皇牌空战7 未知空域》全球累计销量已达700万套

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

如何基于首次下划线分割 Pandas 列为两部分

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

如何基于首次下划线分割 Pandas 列为两部分

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载 学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调 经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

综合素质评价模板哪里下载学生个人填写W

魂斗罗30条命秘籍怎么调经典关卡开启新