page contents

还在用最笨的方式处理字符串?这 5 个技巧该学学了

说实话,Python 里的字符串操作我写了三年才真正玩明白。今天整理了 5 个字符串处理的实用技巧,每个都能让你少写一堆代码。

attachments-2026-05-BYvB36CL6a0d53e3b2c90.png说实话,Python 里的字符串操作我写了三年才真正玩明白。今天整理了 5 个字符串处理的实用技巧,每个都能让你少写一堆代码。

1. 用 format_map 处理字典模板

写周报的时候顺手用了这个技巧,领导问我是不是偷偷加班了。

很多人会这样写:

data = {'name': 'Alice', 'age': 30}
tmpl = 'Name: {name}, Age: {age}, City: {city}'
try:
    result = tmpl.format(**data)
except KeyError:
...

其实可以这样:

class SafeDict(dict):
    def __missing__(self, key):
        return f'{{{key}}}'

data = {'name': 'Alice', 'age': 30}
tmpl = 'Name: {name}, Age: {age}, City: {city}'
...

format_map 配合自定义 missing 的字典,可以优雅地处理模板中缺失的键,保留未替换的占位符而不报错。

2. 用 str.partition 分割并保留分隔符

面试的时候这个经常被问到,写对了加分不少。

很多人会这样写:


url = 'https://example.com/path?query=1'
idx = url.find('?')
if idx != -1:
    base, query = url[:idx], url[idx+1:]

其实可以这样:


url = 'https://example.com/path?query=1'
base, sep, query = url.partition('?')
print(base, query)

partition() 返回 (前, 分隔符, 后) 三元组,找不到分隔符时后两项为空字符串,不会抛异常,比 find+切片更安全。

3. 用 title() 和 capitalize() 处理大小写

Stack Overflow 上这个问题被问了几万次,最佳答案就是这样写。

很多人会这样写:


name = 'hello world'
result = name[0].upper() + name[1:]

其实可以这样:


name = 'hello world'
print(name.capitalize())  # 'Hello world'
print(name.title())       # 'Hello World'
print(name.upper())       # 'HELLO WORLD'
print(name.swapcase())    # 'HELLO WORLD'

Python 字符串内置多种大小写转换方法:capitalize 首字母大写,title 每个单词首字母大写,swapcase 大小写互换。

4. 用 re.sub 进行正则替换

有次代码评审被同事用这招秀了一脸,回去立马学会了。

很多人会这样写:


text = 'Hello   World   Python'
while '  ' in text:
    text = text.replace('  ', ' ')
print(text)

其实可以这样:


import re
text = 'Hello   World   Python'
result = re.sub(r'\s+', ' ', text)
print(result)  # 'Hello World Python'

re.sub() 用正则一次搞定多种空白字符的合并,比循环 replace 更可靠且能处理制表符等特殊空白。

5. 用 splitlines() 替代 split('\n')

这是 Python 老手和新手之间最明显的代码差距之一。

很多人会这样写:


text = 'line1\nline2\r\nline3'
lines = text.split('\n')
print(lines)  # ['line1', 'line2\r', 'line3']

其实可以这样:


text = 'line1\nline2\r\nline3'
lines = text.splitlines()
print(lines)  # ['line1', 'line2', 'line3']

splitlines() 能正确处理所有平台的换行符(\n, \r\n, \r),而 split('\n') 在遇到 Windows 换行时会残留 \r。

这 5 招不算高深,但胜在实用。能在项目里用起来的才是真本事。

你在工作中用过哪几个?评论区说说。

 更多相关技术内容咨询欢迎前往并持续关注好学星城论坛了解详情。

想高效系统的学习Python编程语言,推荐大家关注一个微信公众号:Python编程学习圈。每天分享行业资讯、技术干货供大家阅读,关注即可免费领取整套Python入门到进阶的学习资料以及教程,感兴趣的小伙伴赶紧行动起来吧。

attachments-2022-05-rLS4AIF8628ee5f3b7e12.jpg

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
Pack
Pack

2059 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 2228 文章
  3. Pack 2059 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章