boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

如何用Python进行图像处理(PIL/Pillow)?


avatar
作者 2025年9月6日 12

pillow因其历史悠久、API直观、性能良好且与python生态融合度高,成为Python图像处理首选库;它广泛应用于Web图片处理、数据增强、动态图像生成等场景,支持缩放、裁剪、旋转、滤镜、合成和文字添加等操作;对于大图像或复杂计算,可结合numpy或选用opencv、Scikit-image以提升性能。

如何用Python进行图像处理(PIL/Pillow)?

说起Python里的图像处理,PIL或者说它的现代分支Pillow,绝对是我的首选。它就像一个瑞士军刀,轻巧、功能全面,无论是简单的图片缩放、格式转换,还是稍微复杂一点的图像合成、滤镜应用,都能轻松搞定。对我而言,Pillow的魅力在于它让那些原本可能需要专业图像软件才能完成的任务,变得触手可及,几行Python代码就能实现,效率提升不是一点半点。

解决方案

要用Python进行图像处理,我们首先得请出Pillow这个得力助手。如果你的环境里还没有它,一个简单的

pip install Pillow

就能把它请进门。

一旦安装妥当,Pillow的核心操作围绕着

Image

对象展开。打开一张图片,就像翻开一本书:

from PIL import Image  try:     img = Image.open("example.jpg")     print(f"图片尺寸: {img.size}, 格式: {img.format}, 模式: {img.mode}") except FileNotFoundError:     print("图片文件未找到,请确保'example.jpg'存在。")     # 创建一个简单的图片作为示例     img = Image.new('RGB', (200, 100), color = 'red')     img.save("example.jpg")     print("已创建一个红色的200x100像素图片作为示例:example.jpg")     img = Image.open("example.jpg")  # 接下来,我们就可以对这个Image对象进行各种操作了。  # 1. 调整尺寸 (Resize) # 我经常需要把大图缩小,比如做缩略图。Pillow提供了多种插值算法,通常Lanczos效果最好。 resized_img = img.resize((128, 128), Image.LANCZOS) resized_img.save("resized_example.jpg") print("图片已缩放并保存为 resized_example.jpg")  # 2. 裁剪 (Crop) # 想要图片某个特定区域?裁剪功能非常实用。坐标是(左, 上, 右, 下)。 cropped_img = img.crop((50, 25, 150, 75)) # 裁剪中间的100x50区域 cropped_img.save("cropped_example.jpg") print("图片已裁剪并保存为 cropped_example.jpg")  # 3. 旋转 (Rotate) # 图像旋转也是常见需求,比如修正照片方向。 rotated_img = img.rotate(45, expand=True) # expand=True 会让图片完整显示,画布会变大 rotated_img.save("rotated_example.jpg") print("图片已旋转并保存为 rotated_example.jpg")  # 4. 颜色模式转换 (Convert Mode) # 有时候我们需要将图片转换为灰度图,或者从RGB转为RGBA以支持透明度。 gray_img = img.convert("L") # L代表灰度模式 gray_img.save("gray_example.jpg") print("图片已转换为灰度图并保存为 gray_example.jpg")  # 5. 应用滤镜 (apply Filters) # Pillow内置了一些基础滤镜,比如模糊、锐化等。 from PIL import ImageFilter blurred_img = img.filter(ImageFilter.BLUR) blurred_img.save("blurred_example.jpg") print("图片已应用模糊滤镜并保存为 blurred_example.jpg")  # 6. 图像合成 (Image Compositing) # 叠加水印或者将两张图合在一起,Pillow也能胜任。 # 假设我们有一张小图标作为水印 watermark = Image.new('RGBA', (50, 20), color = (0, 0, 255, 128)) # 半透明蓝色水印 # 将水印粘贴到原图的右下角 img_with_watermark = img.copy() img_with_watermark.paste(watermark, (img.width - watermark.width - 10, img.height - watermark.height - 10), watermark) img_with_watermark.save("watermarked_example.jpg") print("图片已添加水印并保存为 watermarked_example.jpg")  # 7. 添加文字 (Adding Text) # 给图片加点文字说明,比如生成证书或者动态图片。 from PIL import ImageDraw, ImageFont draw = ImageDraw.Draw(img) try:     font = ImageFont.truetype("arial.ttf", 20) # 尝试加载字体 except IOError:     # 如果系统没有arial.ttf,就用默认字体     font = ImageFont.load_default()     print("arial.ttf未找到,使用默认字体。")  text = "Hello, Pillow!" text_color = (255, 255, 0) # 黄色 draw.text((10, 10), text, font=font, fill=text_color) img.save("text_example.jpg") print("图片已添加文字并保存为 text_example.jpg")  # 最后,别忘了在处理完后关闭图片对象,尽管Python的垃圾回收机制通常会处理好。 img.close()

这只是Pillow能力的一小部分,但足以覆盖日常大部分图像处理需求了。它的API设计得相当直观,用起来非常顺手。

立即学习Python免费学习笔记(深入)”;

为什么PIL/Pillow是Python图像处理的首选库?

在我看来,Pillow之所以能成为Python图像处理的“C位”,原因有很多。首先,它的历史很悠久,是基于经典的PIL(Python Imaging Library)发展而来的。PIL虽然强大,但在Python 3时代就停止了维护,Pillow完美地接过了接力棒,不仅兼容了PIL的API,还持续更新,修复了大量bug,并增加了对新图像格式的支持。这种传承和发展,让它拥有了坚实的基础和活跃的社区。

其次,它的API设计非常“Pythonic”,直观易用。你不需要深入了解复杂的图像算法,就能通过

open()

resize()

save()

这些清晰明了的函数名完成操作。对于我这种更侧重应用而非底层算法的开发者来说,这大大降低了学习曲线。而且,Pillow在性能上做得也相当不错,对于大多数桌面应用和Web服务中的图像处理任务,它的速度完全够用,因为它底层很多操作都是用c语言实现的,效率有保障。

再者,Pillow与Python生态系统的融合度很高。它能很好地与NumPy数组协同工作,这意味着你可以将图像数据轻松转换为NumPy数组进行更复杂的数学运算,然后再转回Pillow的

Image

对象进行保存或显示。这种无缝衔接,让它在数据科学和机器学习领域也占有一席之地,比如在图像预处理、数据增强等环节,Pillow常常是我的第一选择。

PIL/Pillow在实际项目中常见的应用场景有哪些?

Pillow的应用场景远比我们想象的要广泛。我个人在很多项目中都依赖它来处理图像,它简直是我的“万能工具”。

一个非常常见的场景是Web应用中的图片处理。比如,用户上传了一张高分辨率的照片,我们通常需要生成不同尺寸的缩略图、头像,或者对图片进行压缩以减少加载时间。Pillow可以轻松实现这些,比如批量调整图片大小、添加水印(防止盗用)、甚至将图片转换为WebP等更高效的格式。我曾经用Pillow写过一个简单的flask服务,专门处理用户上传的图片,根据不同的请求返回不同尺寸和质量的版本,大大优化了用户体验。

数据增强是Pillow在机器学习领域的一个重要应用。为了提高模型的泛化能力,我们常常需要对训练集中的图片进行随机变换,比如旋转、翻转、裁剪、调整亮度或对比度等。Pillow提供的方法可以直接作用于图像对象,非常方便地生成这些变体,为深度学习模型提供更丰富的数据。

如何用Python进行图像处理(PIL/Pillow)?

Revid AI

AI短视频生成平台

如何用Python进行图像处理(PIL/Pillow)?27

查看详情 如何用Python进行图像处理(PIL/Pillow)?

此外,自动化报告或动态图片生成也是Pillow大显身手的地方。想象一下,你需要根据数据库中的数据,自动生成带有图表、文字的图片报告,或者制作一些带有用户信息的个性化图片(比如生日祝福图)。Pillow的

ImageDraw

模块允许你在图片上绘制图形、添加文字,结合

ImageFont

,你可以实现非常精美的定制化输出。我曾用它来生成带有动态二维码和文字的活动门票,效率比手动制作高出无数倍。

最后,一些简单的图像分析和处理任务,比如获取图片某个区域的像素值、计算颜色直方图、或者将图片转换为特定颜色空间(如HSV),Pillow也都能提供基础支持。虽然它不是专业的计算机视觉库,但对于这些“小而美”的需求,它足够了。

处理大图像或进行复杂操作时,PIL/Pillow有哪些性能考量和替代方案?

虽然Pillow对于日常任务来说性能卓越,但当面对超大尺寸图像(比如几万像素级别的遥感影像),或者需要进行大量重复的像素级复杂计算时,我确实遇到过它的性能瓶颈。Pillow虽然底层有C实现,但其Python对象的开销、以及某些操作的单线程特性,在大规模数据面前可能会显得力不从心。内存占用也是一个需要考虑的问题,一张几GB的图片,如果一次性加载到内存并进行复杂操作,很容易导致内存溢出。

在这种情况下,我会开始考虑一些更专业的替代方案:

  1. OpenCV (Open Source Computer Vision Library):这是图像处理和计算机视觉领域的“重型武器”。OpenCV用C++编写,并提供了python接口,其性能经过高度优化,尤其擅长处理视频流、实时图像分析、复杂的图像变换、特征提取等任务。如果你的项目涉及物体识别、人脸识别、图像拼接等高级计算机视觉功能,或者需要处理大量高清图像并追求极致性能,那么OpenCV几乎是不可替代的选择。它的学习曲线相对陡峭一些,但提供的功能和性能是Pillow无法比拟的。

  2. Scikit-image:这是一个基于NumPy的科学图像处理库,与scipy生态系统紧密结合。它提供了大量用于图像分割、特征提取、几何变换、形态学操作等功能的算法。Scikit-image的优势在于其与NumPy的紧密集成,使得你可以直接在NumPy数组上进行高效的数值计算,这对于科学研究和数据分析场景非常有利。如果你的任务更偏向于图像的科学分析、量化测量,而不是简单的编辑和显示,Scikit-image会是比Pillow更好的选择。

  3. 直接使用NumPy进行像素操作:很多时候,Pillow的

    Image

    对象可以方便地转换为NumPy数组(

    np.Array(img)

    ),反之亦然(

    Image.fromarray(np_array)

    )。对于某些需要直接操作像素值的任务,比如自定义滤镜、复杂的色彩空间转换,直接将图像转换为NumPy数组后,利用NumPy的广播机制和向量化操作,可以实现比Pillow原生方法快得多的计算速度。我有时会结合使用:Pillow负责图像的加载和保存,而中间的复杂计算则交给NumPy。

选择哪个工具,很大程度上取决于项目的具体需求和性能瓶颈所在。对于绝大多数的日常图像处理任务,Pillow依然是我的首选。但如果我发现Pillow在某个环节成为了性能瓶颈,或者需要实现一些Pillow不擅长的复杂算法,我就会毫不犹豫地转向OpenCV或Scikit-image。它们各有侧重,共同构成了Python强大的图像处理生态系统。



评论(已关闭)

评论已关闭