boxmoe_header_banner_img

Hello! 欢迎来到悠悠畅享网!

文章导读

实时音频控制:基于PyAudio的无限时长声音播放与停止


avatar
作者 2025年8月21日 41

实时音频控制:基于PyAudio的无限时长声音播放与停止

本文介绍如何使用PyAudio库实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。通过修改原始代码中的循环结构和停止音频流的方式,实现对声音播放的精确控制,避免了预先定义音频时长的限制,并提供了代码示例和注意事项,帮助开发者更好地理解和应用该技术。

实现无限时长声音播放与停止

原始代码中存在一个关键问题:音频流的播放被限制在一个内部的while循环中,并且循环只执行一次。这导致声音只能播放很短的时间。要实现按下按钮开始播放声音,松开按钮停止声音的效果,需要对代码结构进行调整。

核心思路:

  1. 移除时长限制: 不再预先定义音频的时长,而是持续生成音频数据并播放,直到接收到停止信号。
  2. 外部循环控制: 使用外部循环来监听MIDI输入,根据按键状态控制音频流的启动和停止。
  3. 实时音频流控制: 在接收到停止信号时,立即停止音频流。

修改后的代码:

import time from rtmidi.midiutil import open_midiinput import numpy as np import pyaudio  p = pyaudio.PyAudio() # play = True  # Removed this line  volume = 0.5  # range [0.0, 1.0] fs = 44100  # sampling rate, Hz, must be integer # duration = 5.0  # in seconds, may be float # Removed duration fA = 440.0  # sine frequency, Hz, may be float fB = 493.88 fC = 523.25 fD = 587.33  frekvence = 440  frekvence_seznam = {     (144, 32): fA,     (144, 33): fB,     (144, 34): fC,     (144, 35): fD, }  port = 0  midiin, port_name = open_midiinput(port)  stream = None  # Initialize stream outside the loop  try:     while True:         msg = midiin.get_message()          if msg:             message = msg             klic = message[0]             lepsi_klic = tuple(klic[:2])             print(message[0])              if lepsi_klic in frekvence_seznam:                 print("je to tam")                 frekvence = frekvence_seznam[lepsi_klic]                  period = 2 * np.pi                 # Removed duration from np.arange                 x = period * np.arange(fs * 0.1) * frekvence / fs # Use a small chunk size                  sinus = np.sin(x)                 square = np.sign(sinus)                 triangle = 2/np.pi * np.arcsin(np.sin(x))                 saw = abs((x % period) - 1)                 curvy_triangle = (abs((x % period) - 1)) ** 2                  samples = (triangle).astype(np.float32)                  # for paFloat32 sample values must be in range [-1.0, 1.0]                 if stream is None or not stream.is_active(): # Check if stream is active                     stream = p.open(format=pyaudio.paFloat32,                                     channels=1,                                     rate=fs,                                     output=True)                  vysledek = volume * samples                  # spusteni zvuku                 stream.write(vysledek) #Removed while Loop and just write one chunk              elif lepsi_klic == (128, 32) or lepsi_klic == (128, 33) or lepsi_klic == (128, 34) or lepsi_klic == (128, 35): # Key released                 print("Key Released")                 if stream is not None and stream.is_active():                     stream.stop_stream()              elif lepsi_klic == (144, 81):                 break # Exit the main loop finally:     if stream is not None and stream.is_active():         stream.stop_stream()     if stream is not None:         stream.close()     p.terminate()     print("Program terminated.")

代码解释:

  1. 移除duration: 不再预先定义音频时长。
  2. 移除内部while循环: 去掉了while play == True循环,直接在if语句块中写入音频数据。
  3. 使用小chunk size: 使用小的chunk size,例如fs * 0.1,使得音频可以更快的响应按键释放。
  4. 按键释放检测: 增加了对按键释放事件的检测(例如,MIDI消息(128, 32)),当检测到按键释放时,停止音频流。
  5. 流的初始化和判断: 在循环外部初始化 stream = None,并在每次播放前检查 stream 是否已经创建和激活,避免重复创建。
  6. 异常处理: 使用try…finally块确保程序退出时能够正确关闭音频流和PyAudio实例。

注意事项:

  • MIDI消息: MIDI消息的具体数值取决于MIDI键盘的设置。请根据实际情况调整代码中的MIDI消息值。
  • 性能优化 持续生成和播放音频数据可能会消耗一定的CPU资源。如果需要处理复杂的音频效果,可以考虑使用更高效的音频处理库,例如librosa或sounddevice。
  • 音频流控制: 确保在程序退出前正确关闭音频流,释放资源。
  • chunk size: 调整np.arange(fs * 0.1)中的0.1可以调整每次写入音频流的数据量,影响响应速度和CPU占用。

总结:

通过修改原始代码的循环结构和音频流控制方式,可以实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。这种方法避免了预先定义音频时长的限制,提供了更大的灵活性。在实际应用中,可以根据需要调整代码,实现更复杂的音频效果。



评论(已关闭)

评论已关闭