Xin chào kỹ thuật viên, trong hướng dẫn này, chúng ta sẽ tìm hiểu cách xây dựng một máy ghi âm đơn giản bằng Python bằng cách nhập một số mô-đun Show Để xây dựng ứng dụng này, chúng tôi cần cài đặt sounddevice và scipy trong hệ thống của mình Bạn cũng có thể kiểm tra. Máy tính lệnh bằng giọng nói trong Python sử dụng nhận dạng giọng nói và PyAudio Cài đặt các gói để ghi lại âm thanh trong PythonChúng ta cần vào terminal và gõ các lệnh sau Thiết bị âm thanh. Về cơ bản sounddevice là một mô-đun, cung cấp các chức năng để ghi và phát các mảng có nhiều mảng Để cài đặt sounddevice, chúng ta cần viết lệnh sau pip install sounddevice scipy. Viết tắt của Science Python, được sử dụng để lưu âm thanh dưới dạng tệp Lệnh cài đặt scipy là… pip install scipy Định nghĩa biếnTính thường xuyên. Biến đầu tiên là tần số, theo mặc định tần số là 48000 hoặc 44100 Khoảng thời gian. Biến thứ hai là thời lượng ghi âm, chúng tôi có thể ghi lại âm thanh trong khoảng thời gian chúng tôi muốn Chương trình Python để ghi lại âm thanhimport sounddevice import scipy.io.wavfile import write fps = 44100 duration = 12 print('Recording...') recording = sounddevice.rec(int(duration*fps),samplerate = fps , channels = 2) sounddevice.wait() print('Done!') write("Output.wav" , fps, recording) # for saving our recording in wav file thiết bị âm thanh. rec(int(duration*fps),samplerate = fps ,channels = 2), chức năng này được sử dụng để gửi dữ liệu âm thanh đến mảng ở dạng numpy thiết bị âm thanh. wait(), phương thức đợi được sử dụng để đợi cho đến khi quá trình ghi hoàn tất Để lưu bản ghi dưới dạng tệp wav, chúng tôi đã viết hàm write() Trong chức năng ghi, bạn có thể chọn tên tệp của riêng mình nhưng. phần mở rộng wav là bắt buộc đầu raRecording... Done! Ở phần Đầu ra, sau khi in thông báo ‘Đang ghi…’ hãy nói điều gì đó để chúng tôi kiểm tra đầu ra. Sau 12 giây, chúng tôi sẽ nhận được thông báo là 'Xong. ’ Sau đó, nhấp chuột phải vào Đầu ra. wav, hãy chọn Hiển thị trong trình khám phá tệp Bằng cách chọn tiết lộ trong trình khám phá tệp, chúng tôi sẽ nhập vào trình quản lý tệp của mình, sau đó nhấp chuột phải vào Đầu ra. tập tin wav Vì trăn hầu như có thể làm mọi thứ mà người ta có thể tưởng tượng bao gồm phát và ghi âm thanh. Bài viết này sẽ giúp bạn làm quen với một số thư viện python và các phương pháp chuyển tiếp thẳng bằng cách sử dụng các thư viện đó để phát và ghi âm thanh trong python, với một số chức năng khác để đổi lấy một số dòng python bổ sung Hầu hết các tệp âm thanh đều ở định dạng tệp MP3 và WAV. Các tệp âm thanh WAV là định dạng âm thanh kỹ thuật số đơn giản nhất với tốc độ ghi cao không mất dữ liệu do đó các tệp WAV có dung lượng lớn so với các định dạng khác. Vì lý do tương tự, các định dạng MP3 được sử dụng có kích thước nhỏ và nén các tệp với rất ít sự khác biệt đối với chất lượng âm thanh tổng thể. Ngoài ra, rất dễ dàng chuyển đổi WAV sang MP3 bằng phần mềm mã nguồn mở và miễn phí được phổ biến rộng rãi trên internet Phát âm thanhDưới đây được đề cập là một số thư viện python mà bạn có thể phát các định dạng âm thanh khác nhau trong python bao gồm định dạng MP3, định dạng WAV và thậm chí cả mảng NumPy. Phương pháp 1. Sử dụng Playsound Gói sẵn sàng sử dụng để phát các tệp âm thanh chỉ với một dòng mã. Người ta có thể phát các tệp WAV hoặc MP3 với nó. Đó là một mô-đun chức năng duy nhất không phụ thuộc vào việc phát âm thanh. Tài liệu về thư viện playsound đề cập rằng nó đã được thử nghiệm cho các tệp WAV và MP3, nhưng cũng có thể hoạt động với các định dạng tệp khác mà việc kiểm tra tùy thuộc vào người dùng. Mô-đun playsound chỉ chứa một thứ - chức năng (còn được đặt tên) playound Sau đây là các dòng mã để phát một tệp Python3
đầu ra
https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106104353/1. phát âm thanh. mp4
Phương pháp 2. Sử dụng Simpleaudio
ví dụ 1
Đây là thư viện python đa nền tảng để phát lại cả tệp WAV đơn âm và âm thanh nổi mà không có phụ thuộc nào khác để phát lại âm thanh. Trăn 3. 7 trở lên được hỗ trợ chính thức trên macOS, Windows và Linux.
Sau đây là mã đơn giản để chơi một. wav mặc dù nó tiêu tốn ít dòng mã hơn so với thư viện trên
Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106104928/2. -simpleaudio. mp4 ví dụ 2 Simpleaudio có thể được sử dụng để phát các đối tượng byte & mảng NumPy và Python bằng cách sử dụng Simpleaudio. play_buffer() Mảng Numpy có thể được sử dụng để lưu trữ âm thanh nhưng có một số yêu cầu quan trọng. Nếu chúng lưu trữ âm thanh nổi, mảng phải có hai cột, mỗi cột chứa một kênh dữ liệu âm thanh. Chúng cũng phải có loại d số nguyên 16 bit đã ký và các giá trị biên độ mẫu do đó phải nằm trong khoảng từ -32768 đến 32767. Dưới đây là mã để tạo một mảng NumPy và phát lại bằng cách sử dụng âm thanh đơn giản. play_buffer() Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106105228/2. 1-simpleaudio. mp4 Phương pháp 3. sử dụng winound ví dụ 1 Đó là mô-đun tích hợp để truy cập cơ chế phát âm thanh cơ bản. Nó chỉ cho phép bạn phát các tệp WAV (nó không hỗ trợ bất kỳ định dạng tệp nào khác) hoặc phát ra tiếng bíp từ loa của bạn, nhưng nó chỉ hoạt động trên Windows như tên gợi ý WINsound. Đó là mô-đun tích hợp nên không cần cài đặt thêm Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106110137/3. 1-winsound. mp4 ví dụ 2 Nó cũng có thể được sử dụng để phát ra tiếng bíp cho loa của bạn hoặc Phát (các) âm thanh mặc định của Windows. Trong đoạn mã sau, âm thanh bíp 5000Hz được phát trong 1000ms sau âm thanh thoát của cửa sổ. Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106110140/3. 2-winsound. mp4 Nhược điểm chính của thư viện này là nó chỉ dành cho người dùng hệ điều hành Windows và cũng không hỗ trợ phát lại bất kỳ tệp nào khác ngoài định dạng WAV Phương pháp 4. Sử dụng thiết bị âm thanh Mô-đun Python này cung cấp các liên kết cho thư viện PortAudio và một số chức năng tiện lợi để phát và ghi các mảng NumPy có chứa tín hiệu âm thanh. Nó có sẵn cho các hệ điều hành Linux, macOS và Windows Trong đoạn mã sau, một dòng chứa ‘ sf. read() ‘ trích xuất tất cả dữ liệu âm thanh thô cùng với tốc độ lấy mẫu của tệp như được lưu trữ trong tiêu đề RIFF của nó; . wait() ‘ đảm bảo rằng tập lệnh kết thúc sau ‘ sd. phát (dữ liệu, sr) ‘ kết thúc phát âm thanh Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106112410/4. 1-thiết bị âm thanh. mp4 Phương pháp 5. sử dụng pydub Mặc dù pydub có thể dễ dàng mở và lưu các tệp WAV mà không có bất kỳ phụ thuộc nào khác, nhưng phải cài đặt sẵn ít nhất một gói phát lại âm thanh từ (simpleaudio, pyaudio, ffplay và avplay ). Nó cung cấp triển khai python thuần túy để thao tác âm thanh Mã sau nhập hai thư viện, thư viện đầu tiên tải tệp và thư viện thứ hai để phát tệp đã tải. Ngoài ra, hai cách được trình bày để tải. tập tin wav Python3
đầu ra
https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106112416/5. 1-pydub. mp4
Phương pháp 6. Sử dụng pyaudio
PyAudio là một thư viện âm thanh đa nền tảng khác dành cho Python. Mặc dù nó có nhiều khả năng hơn thư viện âm thanh đơn giản, chẳng hạn như ghi âm và truyền phát âm thanh liên tục, nhưng phần lớn phụ thuộc vào việc có PortAudio dẫn đến việc cài đặt phức tạp hơn. Nó cũng cung cấp các ràng buộc Python cho PortAudio, thư viện I/O âm thanh đa nền tảng do python-sounddevice cung cấp. Với PyAudio, bạn có thể dễ dàng sử dụng Python để phát và ghi âm thanh trên nhiều nền tảng khác nhau
Python3
đầu ra https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106121909/6. -pyaudio_play. mp4 Ghi âm thanhBây giờ chỉ cần chuyển sang chế độ ghi lại bài viết. Rất ít thư viện được đề cập ở trên được sử dụng cho cùng một mục đích, cả phát và ghi đều có thể được giải thích chung nhưng đối với nhiều thư viện, nó có thể hơi khó hiểu. Vì vậy, các phần dành riêng khác nhau được ưu tiên ở đây Lưu ý- Trước khi sử dụng bất kỳ thư viện nào để ghi âm, hãy đảm bảo rằng micrô của thiết bị của bạn thực sự được kết nối và BẬT cũng như không bị Tắt tiếng. người ta có thể kiểm tra tương tự bằng cách sử dụng các tính năng và cài đặt của hệ điều hành Phương pháp 1. Sử dụng python-sounddevice Thư viện này cho phép bạn phát (đã giải thích ở trên) và ghi lại các mảng NumPy chứa thông tin tín hiệu âm thanh. Mô-đun này yêu cầu scipy hoặc wavio để lưu âm thanh đã ghi, điều này có nghĩa là thư viện scipy hoặc wavio phải được cài đặt sẵn cùng với Numpy trước khi sử dụng gói này để ghi Python3
đầu ra
https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210106114323/1. -record_soundvice. mp4
Như đã nêu trong phần Âm thanh, thiết bị âm thanh có tùy chọn mặc định để chỉ định kênh và tần số cho việc sử dụng lặp lại. Sau đó, không cần chuyển tùy chọn này làm đối số trong sd. phương thức rec(). Đoạn mã sau thể hiện điều tương tự cùng với việc người ta cũng có thể thay đổi kiểu dữ liệu của mảng đã ghi từ kiểu mặc định float32 sang kiểu khác
Python3
Phát lại và ghi đồng thời
Để Phát một mảng có tên my_arr và Ghi cùng lúc. Ở đây tỷ lệ mẫu là smpl_rate
Python3
https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210101111541/play_rec. mp4
Phương pháp 2. Sử dụng pyaudio
Như trên, chúng tôi đã phát âm thanh bằng pyaudio bằng cách đọc tệp pyaudio. Suối(). Để ghi lại âm thanh, chúng ta phải ghi vào cùng một luồng này. Sau đây là đoạn mã để ghi lại một vài giây âm thanh và lưu đoạn mã đó vào một. tập tin wav
Python3
Mô-đun Sounddevice trong Python là gì?Như đã nêu trong tài liệu của nó, python-sounddevice “ cung cấp các liên kết cho thư viện PortAudio và một vài chức năng tiện lợi để phát và ghi các mảng NumPy chứa tín hiệu âm thanh”. In order to play WAV files, numpy and soundfile need to be installed, to open WAV files as NumPy arrays.
Làm cách nào để đọc tệp WAV bằng Python?Các mô-đun Python khác nhau để đọc wav. . Tập tin âm thanh scipy. io. . sóng (để đọc dòng. Bao gồm trong Python 2 và 3) scikits. . sounddevice (phát và ghi lại âm thanh, tốt cho luồng và thời gian thực) người lùn librosa (phân tích âm nhạc và âm thanh) madmom (tập trung nhiều vào các nhiệm vụ truy xuất thông tin âm nhạc (MIR)) |