文章导读

实时音频控制：基于PyAudio的无限时长声音播放与停止

作者 2025年8月21日 41

本文介绍如何使用PyAudio库实现按下按钮开始播放声音，松开按钮停止声音的实时音频控制。通过修改原始代码中的循环结构和停止音频流的方式，实现对声音播放的精确控制，避免了预先定义音频时长的限制，并提供了代码示例和注意事项，帮助开发者更好地理解和应用该技术。

实现无限时长声音播放与停止

原始代码中存在一个关键问题：音频流的播放被限制在一个内部的while循环中，并且循环只执行一次。这导致声音只能播放很短的时间。要实现按下按钮开始播放声音，松开按钮停止声音的效果，需要对代码结构进行调整。

核心思路：

移除时长限制： 不再预先定义音频的时长，而是持续生成音频数据并播放，直到接收到停止信号。
外部循环控制： 使用外部循环来监听MIDI输入，根据按键状态控制音频流的启动和停止。
实时音频流控制： 在接收到停止信号时，立即停止音频流。

修改后的代码：

import time from rtmidi.midiutil import open_midiinput import numpy as np import pyaudio  p = pyaudio.PyAudio() # play = True  # Removed this line  volume = 0.5  # range [0.0, 1.0] fs = 44100  # sampling rate, Hz, must be integer # duration = 5.0  # in seconds, may be float # Removed duration fA = 440.0  # sine frequency, Hz, may be float fB = 493.88 fC = 523.25 fD = 587.33  frekvence = 440  frekvence_seznam = {     (144, 32): fA,     (144, 33): fB,     (144, 34): fC,     (144, 35): fD, }  port = 0  midiin, port_name = open_midiinput(port)  stream = None  # Initialize stream outside the loop  try:     while True:         msg = midiin.get_message()          if msg:             message = msg             klic = message[0]             lepsi_klic = tuple(klic[:2])             print(message[0])              if lepsi_klic in frekvence_seznam:                 print("je to tam")                 frekvence = frekvence_seznam[lepsi_klic]                  period = 2 * np.pi                 # Removed duration from np.arange                 x = period * np.arange(fs * 0.1) * frekvence / fs # Use a small chunk size                  sinus = np.sin(x)                 square = np.sign(sinus)                 triangle = 2/np.pi * np.arcsin(np.sin(x))                 saw = abs((x % period) - 1)                 curvy_triangle = (abs((x % period) - 1)) ** 2                  samples = (triangle).astype(np.float32)                  # for paFloat32 sample values must be in range [-1.0, 1.0]                 if stream is None or not stream.is_active(): # Check if stream is active                     stream = p.open(format=pyaudio.paFloat32,                                     channels=1,                                     rate=fs,                                     output=True)                  vysledek = volume * samples                  # spusteni zvuku                 stream.write(vysledek) #Removed while Loop and just write one chunk              elif lepsi_klic == (128, 32) or lepsi_klic == (128, 33) or lepsi_klic == (128, 34) or lepsi_klic == (128, 35): # Key released                 print("Key Released")                 if stream is not None and stream.is_active():                     stream.stop_stream()              elif lepsi_klic == (144, 81):                 break # Exit the main loop finally:     if stream is not None and stream.is_active():         stream.stop_stream()     if stream is not None:         stream.close()     p.terminate()     print("Program terminated.")

代码解释：

移除duration： 不再预先定义音频时长。
移除内部while循环： 去掉了while play == True循环，直接在if语句块中写入音频数据。
使用小chunk size: 使用小的chunk size，例如fs * 0.1，使得音频可以更快的响应按键释放。
按键释放检测： 增加了对按键释放事件的检测（例如，MIDI消息(128, 32)），当检测到按键释放时，停止音频流。
流的初始化和判断： 在循环外部初始化 stream = None，并在每次播放前检查 stream 是否已经创建和激活，避免重复创建。
异常处理： 使用try…finally块确保程序退出时能够正确关闭音频流和PyAudio实例。

注意事项：

MIDI消息： MIDI消息的具体数值取决于MIDI键盘的设置。请根据实际情况调整代码中的MIDI消息值。
性能优化：持续生成和播放音频数据可能会消耗一定的CPU资源。如果需要处理复杂的音频效果，可以考虑使用更高效的音频处理库，例如librosa或sounddevice。
音频流控制： 确保在程序退出前正确关闭音频流，释放资源。
chunk size: 调整np.arange(fs * 0.1)中的0.1可以调整每次写入音频流的数据量，影响响应速度和CPU占用。

总结：

通过修改原始代码的循环结构和音频流控制方式，可以实现按下按钮开始播放声音，松开按钮停止声音的实时音频控制。这种方法避免了预先定义音频时长的限制，提供了更大的灵活性。在实际应用中，可以根据需要调整代码，实现更复杂的音频效果。

评论（已关闭）

评论已关闭

Hello! 欢迎来到悠悠畅享网！

实时音频控制：基于PyAudio的无限时长声音播放与停止

实现无限时长声音播放与停止

评论（已关闭）