文章导读

如何用Python进行图像处理（PIL/Pillow）？

作者 2025年9月6日 12

pillow因其历史悠久、API直观、性能良好且与python生态融合度高，成为Python图像处理首选库；它广泛应用于Web图片处理、数据增强、动态图像生成等场景，支持缩放、裁剪、旋转、滤镜、合成和文字添加等操作；对于大图像或复杂计算，可结合numpy或选用opencv、Scikit-image以提升性能。

说起Python里的图像处理，PIL或者说它的现代分支Pillow，绝对是我的首选。它就像一个瑞士军刀，轻巧、功能全面，无论是简单的图片缩放、格式转换，还是稍微复杂一点的图像合成、滤镜应用，都能轻松搞定。对我而言，Pillow的魅力在于它让那些原本可能需要专业图像软件才能完成的任务，变得触手可及，几行Python代码就能实现，效率提升不是一点半点。

解决方案

要用Python进行图像处理，我们首先得请出Pillow这个得力助手。如果你的环境里还没有它，一个简单的

pip install Pillow

就能把它请进门。

一旦安装妥当，Pillow的核心操作围绕着

Image

对象展开。打开一张图片，就像翻开一本书：

from PIL import Image  try:     img = Image.open("example.jpg")     print(f"图片尺寸: {img.size}, 格式: {img.format}, 模式: {img.mode}") except FileNotFoundError:     print("图片文件未找到，请确保'example.jpg'存在。")     # 创建一个简单的图片作为示例     img = Image.new('RGB', (200, 100), color = 'red')     img.save("example.jpg")     print("已创建一个红色的200x100像素图片作为示例：example.jpg")     img = Image.open("example.jpg")  # 接下来，我们就可以对这个Image对象进行各种操作了。  # 1. 调整尺寸 (Resize) # 我经常需要把大图缩小，比如做缩略图。Pillow提供了多种插值算法，通常Lanczos效果最好。 resized_img = img.resize((128, 128), Image.LANCZOS) resized_img.save("resized_example.jpg") print("图片已缩放并保存为 resized_example.jpg")  # 2. 裁剪 (Crop) # 想要图片某个特定区域？裁剪功能非常实用。坐标是(左, 上, 右, 下)。 cropped_img = img.crop((50, 25, 150, 75)) # 裁剪中间的100x50区域 cropped_img.save("cropped_example.jpg") print("图片已裁剪并保存为 cropped_example.jpg")  # 3. 旋转 (Rotate) # 图像旋转也是常见需求，比如修正照片方向。 rotated_img = img.rotate(45, expand=True) # expand=True 会让图片完整显示，画布会变大 rotated_img.save("rotated_example.jpg") print("图片已旋转并保存为 rotated_example.jpg")  # 4. 颜色模式转换 (Convert Mode) # 有时候我们需要将图片转换为灰度图，或者从RGB转为RGBA以支持透明度。 gray_img = img.convert("L") # L代表灰度模式 gray_img.save("gray_example.jpg") print("图片已转换为灰度图并保存为 gray_example.jpg")  # 5. 应用滤镜 (apply Filters) # Pillow内置了一些基础滤镜，比如模糊、锐化等。 from PIL import ImageFilter blurred_img = img.filter(ImageFilter.BLUR) blurred_img.save("blurred_example.jpg") print("图片已应用模糊滤镜并保存为 blurred_example.jpg")  # 6. 图像合成 (Image Compositing) # 叠加水印或者将两张图合在一起，Pillow也能胜任。 # 假设我们有一张小图标作为水印 watermark = Image.new('RGBA', (50, 20), color = (0, 0, 255, 128)) # 半透明蓝色水印 # 将水印粘贴到原图的右下角 img_with_watermark = img.copy() img_with_watermark.paste(watermark, (img.width - watermark.width - 10, img.height - watermark.height - 10), watermark) img_with_watermark.save("watermarked_example.jpg") print("图片已添加水印并保存为 watermarked_example.jpg")  # 7. 添加文字 (Adding Text) # 给图片加点文字说明，比如生成证书或者动态图片。 from PIL import ImageDraw, ImageFont draw = ImageDraw.Draw(img) try:     font = ImageFont.truetype("arial.ttf", 20) # 尝试加载字体 except IOError:     # 如果系统没有arial.ttf，就用默认字体     font = ImageFont.load_default()     print("arial.ttf未找到，使用默认字体。")  text = "Hello, Pillow!" text_color = (255, 255, 0) # 黄色 draw.text((10, 10), text, font=font, fill=text_color) img.save("text_example.jpg") print("图片已添加文字并保存为 text_example.jpg")  # 最后，别忘了在处理完后关闭图片对象，尽管Python的垃圾回收机制通常会处理好。 img.close()

这只是Pillow能力的一小部分，但足以覆盖日常大部分图像处理需求了。它的API设计得相当直观，用起来非常顺手。

立即学习“Python免费学习笔记（深入）”；

为什么PIL/Pillow是Python图像处理的首选库？

在我看来，Pillow之所以能成为Python图像处理的“C位”，原因有很多。首先，它的历史很悠久，是基于经典的PIL（Python Imaging Library）发展而来的。PIL虽然强大，但在Python 3时代就停止了维护，Pillow完美地接过了接力棒，不仅兼容了PIL的API，还持续更新，修复了大量bug，并增加了对新图像格式的支持。这种传承和发展，让它拥有了坚实的基础和活跃的社区。

其次，它的API设计非常“Pythonic”，直观易用。你不需要深入了解复杂的图像算法，就能通过

open()

、

resize()

、

save()

这些清晰明了的函数名完成操作。对于我这种更侧重应用而非底层算法的开发者来说，这大大降低了学习曲线。而且，Pillow在性能上做得也相当不错，对于大多数桌面应用和Web服务中的图像处理任务，它的速度完全够用，因为它底层很多操作都是用c语言实现的，效率有保障。

再者，Pillow与Python生态系统的融合度很高。它能很好地与NumPy数组协同工作，这意味着你可以将图像数据轻松转换为NumPy数组进行更复杂的数学运算，然后再转回Pillow的

Image

对象进行保存或显示。这种无缝衔接，让它在数据科学和机器学习领域也占有一席之地，比如在图像预处理、数据增强等环节，Pillow常常是我的第一选择。

PIL/Pillow在实际项目中常见的应用场景有哪些？

Pillow的应用场景远比我们想象的要广泛。我个人在很多项目中都依赖它来处理图像，它简直是我的“万能工具”。

一个非常常见的场景是Web应用中的图片处理。比如，用户上传了一张高分辨率的照片，我们通常需要生成不同尺寸的缩略图、头像，或者对图片进行压缩以减少加载时间。Pillow可以轻松实现这些，比如批量调整图片大小、添加水印（防止盗用）、甚至将图片转换为WebP等更高效的格式。我曾经用Pillow写过一个简单的flask服务，专门处理用户上传的图片，根据不同的请求返回不同尺寸和质量的版本，大大优化了用户体验。

数据增强是Pillow在机器学习领域的一个重要应用。为了提高模型的泛化能力，我们常常需要对训练集中的图片进行随机变换，比如旋转、翻转、裁剪、调整亮度或对比度等。Pillow提供的方法可以直接作用于图像对象，非常方便地生成这些变体，为深度学习模型提供更丰富的数据。

Revid AI

AI短视频生成平台

查看详情

此外，自动化报告或动态图片生成也是Pillow大显身手的地方。想象一下，你需要根据数据库中的数据，自动生成带有图表、文字的图片报告，或者制作一些带有用户信息的个性化图片（比如生日祝福图）。Pillow的

ImageDraw

模块允许你在图片上绘制图形、添加文字，结合

ImageFont

，你可以实现非常精美的定制化输出。我曾用它来生成带有动态二维码和文字的活动门票，效率比手动制作高出无数倍。

最后，一些简单的图像分析和处理任务，比如获取图片某个区域的像素值、计算颜色直方图、或者将图片转换为特定颜色空间（如HSV），Pillow也都能提供基础支持。虽然它不是专业的计算机视觉库，但对于这些“小而美”的需求，它足够了。

处理大图像或进行复杂操作时，PIL/Pillow有哪些性能考量和替代方案？

虽然Pillow对于日常任务来说性能卓越，但当面对超大尺寸图像（比如几万像素级别的遥感影像），或者需要进行大量重复的像素级复杂计算时，我确实遇到过它的性能瓶颈。Pillow虽然底层有C实现，但其Python对象的开销、以及某些操作的单线程特性，在大规模数据面前可能会显得力不从心。内存占用也是一个需要考虑的问题，一张几GB的图片，如果一次性加载到内存并进行复杂操作，很容易导致内存溢出。

在这种情况下，我会开始考虑一些更专业的替代方案：

OpenCV (Open Source Computer Vision Library)：这是图像处理和计算机视觉领域的“重型武器”。OpenCV用C++编写，并提供了python接口，其性能经过高度优化，尤其擅长处理视频流、实时图像分析、复杂的图像变换、特征提取等任务。如果你的项目涉及物体识别、人脸识别、图像拼接等高级计算机视觉功能，或者需要处理大量高清图像并追求极致性能，那么OpenCV几乎是不可替代的选择。它的学习曲线相对陡峭一些，但提供的功能和性能是Pillow无法比拟的。
Scikit-image：这是一个基于NumPy的科学图像处理库，与scipy生态系统紧密结合。它提供了大量用于图像分割、特征提取、几何变换、形态学操作等功能的算法。Scikit-image的优势在于其与NumPy的紧密集成，使得你可以直接在NumPy数组上进行高效的数值计算，这对于科学研究和数据分析场景非常有利。如果你的任务更偏向于图像的科学分析、量化测量，而不是简单的编辑和显示，Scikit-image会是比Pillow更好的选择。
直接使用NumPy进行像素操作：很多时候，Pillow的
```
Image
```
对象可以方便地转换为NumPy数组（
```
np.Array(img)
```
），反之亦然（
```
Image.fromarray(np_array)
```
）。对于某些需要直接操作像素值的任务，比如自定义滤镜、复杂的色彩空间转换，直接将图像转换为NumPy数组后，利用NumPy的广播机制和向量化操作，可以实现比Pillow原生方法快得多的计算速度。我有时会结合使用：Pillow负责图像的加载和保存，而中间的复杂计算则交给NumPy。

选择哪个工具，很大程度上取决于项目的具体需求和性能瓶颈所在。对于绝大多数的日常图像处理任务，Pillow依然是我的首选。但如果我发现Pillow在某个环节成为了性能瓶颈，或者需要实现一些Pillow不擅长的复杂算法，我就会毫不犹豫地转向OpenCV或Scikit-image。它们各有侧重，共同构成了Python强大的图像处理生态系统。

评论（已关闭）

评论已关闭

Hello! 欢迎来到悠悠畅享网！