Hướng dẫn how do i convert text to speech in python? - làm cách nào để chuyển văn bản thành giọng nói trong python?

Question

Xem thảo luận

Nội dung chính Show

Có một số API có sẵn để chuyển đổi văn bản thành bài phát biểu trong Python. Một trong những API như vậy là API văn bản Google cho bài phát biểu thường được gọi là API GTTS. GTTS là một công cụ rất dễ sử dụng, chuyển đổi văn bản được nhập, thành âm thanh có thể được lưu dưới dạng tệp MP3.
import gtts from playsound import playsound4pip3 install gTTS pyttsx3 playsound9 import gtts from playsound import playsound6pip3 install gTTS pyttsx3 playsound9import gtts from playsound import playsound8pip3 install gTTS pyttsx3 playsound9# make request to google to get synthesis tts = gtts.gTTS("Hello world")0pip3 install gTTS pyttsx3 playsound9# make request to google to get synthesis tts = gtts.gTTS("Hello world")22
Văn bản trực tuyến để nói
Văn bản ngoại tuyến để nói
Sự kết luận
Cũng đọc
Bảng bình luận
Làm thế nào để bạn thay đổi văn bản thành bài phát biểu trong Python?
Làm cách nào để chuyển đổi văn bản thành bài phát biểu?
Làm cách nào để sử dụng Google Text để phát biểu trong Python?
Làm thế nào để bạn thực hiện nhận dạng giọng nói trăn?

Cải thiện bài viết

Lưu bài viết

Đọc

Bàn luận

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

Đọc

Bàn luận

Có một số API có sẵn để chuyển đổi văn bản thành bài phát biểu trong Python. Một trong những API như vậy là API văn bản Google cho bài phát biểu thường được gọi là API GTTS. GTTS là một công cụ rất dễ sử dụng, chuyển đổi văn bản được nhập, thành âm thanh có thể được lưu dưới dạng tệp MP3.

API GTTS hỗ trợ một số ngôn ngữ bao gồm tiếng Anh, tiếng Hindi, tiếng Tamil, tiếng Pháp, tiếng Đức và nhiều thứ khác. Bài phát biểu có thể được đưa ra trong bất kỳ một trong hai tốc độ âm thanh có sẵn, nhanh hoặc chậm. Tuy nhiên, kể từ bản cập nhật mới nhất, không thể thay đổi giọng nói của âm thanh được tạo.

pip install gTTS

Cài đặt
Now we are all set to write a sample program that converts text to speech.

Để cài đặt API GTTS, Open Terminal và viết

Điều này hoạt động cho bất kỳ nền tảng nào. Bây giờ tất cả chúng ta đều được thiết lập để viết một chương trình mẫu chuyển đổi văn bản thành lời nói.

pip3 install gTTS pyttsx3 playsound

2

pip3 install gTTS pyttsx3 playsound

3

pip3 install gTTS pyttsx3 playsound

4

pip3 install gTTS pyttsx3 playsound

5

pip3 install gTTS pyttsx3 playsound

4

pip3 install gTTS pyttsx3 playsound

7

pip3 install gTTS pyttsx3 playsound

8

pip3 install gTTS pyttsx3 playsound

9

import gtts
from playsound import playsound

0

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

4

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

5

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

3

import gtts
from playsound import playsound

1

pip3 install gTTS pyttsx3 playsound

9

import gtts
from playsound import playsound

3

import gtts from playsound import playsound4pip3 install gTTS pyttsx3 playsound9 import gtts from playsound import playsound6pip3 install gTTS pyttsx3 playsound9import gtts from playsound import playsound8pip3 install gTTS pyttsx3 playsound9# make request to google to get synthesis tts = gtts.gTTS("Hello world")0pip3 install gTTS pyttsx3 playsound9# make request to google to get synthesis tts = gtts.gTTS("Hello world")22

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

7

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

8

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

3Akhil Goel. If you like GeeksforGeeks and would like to contribute, you can also write an article using write.geeksforgeeks.org or mail your article to . See your article appearing on the GeeksforGeeks main page and help other Geeks.

Đầu ra

& nbsp; · 7 phút Đọc · Cập nhật tháng 7 năm 2022 · Học máy · Giao diện lập trình ứng dụng · 7 min read · Updated jul 2022 · Machine Learning · Application Programming Interfaces

Tiết lộ: Bài đăng này có thể chứa các liên kết liên kết, có nghĩa là khi bạn nhấp vào liên kết và mua hàng, chúng tôi nhận được hoa hồng.: This post may contain affiliate links, meaning when you click the links and make a purchase, we receive a commission.

Tổng hợp lời nói (hoặc văn bản cho lời nói) là mô phỏng do máy tính tạo ra. Nó chuyển đổi văn bản ngôn ngữ của con người thành âm thanh nói giống con người. Trong hướng dẫn này, bạn sẽ tìm hiểu làm thế nào bạn có thể chuyển đổi văn bản thành bài phát biểu trong Python.In this tutorial, you will learn how you can convert text to speech in Python.

Trong hướng dẫn này, chúng tôi sẽ không xây dựng các mạng lưới thần kinh và đào tạo mô hình để đạt được kết quả, vì nó khá phức tạp và khó thực hiện. Thay vào đó, chúng tôi sẽ sử dụng một số API và động cơ cung cấp nó. Có rất nhiều API ngoài kia cung cấp dịch vụ này, một trong những dịch vụ thường được sử dụng là Google Text to Protears, trong hướng dẫn này, chúng tôi sẽ chơi xung quanh nó cùng với một thư viện ngoại tuyến khác có tên là PyTTSX3.Instead, we gonna use some APIs and engines that offer it. There are a lot of APIs out there that offer this service, one of the commonly used services is Google Text to Speech, in this tutorial, we will play around with it along with another offline library called pyttsx3.

Để làm cho mọi thứ rõ ràng, hướng dẫn này là về việc chuyển đổi văn bản thành lời nói chứ không phải theo cách khác, nếu bạn muốn chuyển đổi bài phát biểu sang văn bản thay thế, hãy kiểm tra hướng dẫn này.

Mục lục:

Văn bản trực tuyến để nói
Văn bản ngoại tuyến để nói

Để bắt đầu, hãy cài đặt các mô -đun cần thiết:

pip3 install gTTS pyttsx3 playsound

Văn bản trực tuyến để nói

Văn bản ngoại tuyến để nói

Để bắt đầu, hãy cài đặt các mô -đun cần thiết:

import gtts
from playsound import playsound

Như bạn có thể đoán, GTTS là viết tắt của Google Text để phát biểu, đó là một thư viện Python để giao diện với văn bản của Google Dịch sang API bài phát biểu. Nó đòi hỏi một kết nối internet và nó khá dễ sử dụng.gTTS object that is an interface to Google Translate's Text to Speech API:

# make request to google to get synthesis
tts = gtts.gTTS("Hello world")

Mở một tệp Python mới và nhập:

# save the audio file
tts.save("hello.mp3")

Thật là đơn giản khi sử dụng thư viện này, bạn chỉ cần chuyển văn bản cho đối tượng GTTS là giao diện cho văn bản của Google Dịch sang API lời nói:

Cho đến thời điểm này, chúng tôi đã gửi văn bản và lấy bài phát biểu âm thanh thực tế từ API, hãy lưu âm thanh này vào một tệp:

Thật tuyệt, bạn sẽ thấy một tệp mới xuất hiện trong thư mục hiện tại, hãy phát nó bằng mô -đun Playsound được cài đặt trước đó:

Nó không chỉ có sẵn bằng tiếng Anh, bạn cũng có thể sử dụng các ngôn ngữ khác bằng cách truyền tham số

# save the audio file
tts.save("hello.mp3")

0:

# in spanish
tts = gtts.gTTS("Hola Mundo", lang="es")
tts.save("hola.mp3")
playsound("hola.mp3")

Nếu bạn không muốn lưu nó vào một tệp và chỉ cần phát trực tiếp, thì bạn nên sử dụng

# save the audio file
tts.save("hello.mp3")

1 chấp nhận đối tượng

# save the audio file
tts.save("hello.mp3")

2 để viết vào, hãy kiểm tra liên kết này để biết thêm thông tin.

Để có được danh sách các ngôn ngữ có sẵn, hãy sử dụng điều này:

# all available languages along with their IETF tag
print(gtts.lang.tts_langs())

Dưới đây là các ngôn ngữ được hỗ trợ:

{'af': 'Afrikaans', 'sq': 'Albanian', 'ar': 'Arabic', 'hy': 'Armenian', 'bn': 'Bengali', 'bs': 'Bosnian', 'ca': 'Catalan', 'hr': 'Croatian', 'cs': 'Czech', 'da': 'Danish', 'nl': 'Dutch', 'en': 'English', 'eo': 'Esperanto', 'et': 'Estonian', 'tl': 'Filipino', 'fi': 'Finnish', 'fr': 'French', 'de': 'German', 'el': 'Greek', 'gu': 'Gujarati', 'hi': 'Hindi', 'hu': 'Hungarian', 'is': 'Icelandic', 'id': 'Indonesian', 'it': 'Italian', 'ja': 'Japanese', 'jw': 'Javanese', 'kn': 'Kannada', 'km': 'Khmer', 'ko': 'Korean', 'la': 'Latin', 'lv': 'Latvian', 'mk': 'Macedonian', 'ml': 'Malayalam', 'mr': 
'Marathi', 'my': 'Myanmar (Burmese)', 'ne': 'Nepali', 'no': 'Norwegian', 'pl': 'Polish', 'pt': 'Portuguese', 'ro': 'Romanian', 'ru': 'Russian', 'sr': 'Serbian', 'si': 'Sinhala', 'sk': 'Slovak', 'es': 'Spanish', 'su': 'Sundanese', 'sw': 'Swahili', 'sv': 'Swedish', 'ta': 'Tamil', 'te': 'Telugu', 'th': 'Thai', 'tr': 'Turkish', 'uk': 'Ukrainian', 'ur': 'Urdu', 'vi': 'Vietnamese', 'cy': 'Welsh', 'zh-cn': 'Chinese (Mandarin/China)', 'zh-tw': 'Chinese (Mandarin/Taiwan)', 'en-us': 'English (US)', 'en-ca': 'English (Canada)', 'en-uk': 'English (UK)', 'en-gb': 'English (UK)', 'en-au': 'English (Australia)', 'en-gh': 'English (Ghana)', 'en-in': 'English (India)', 'en-ie': 'English (Ireland)', 'en-nz': 'English (New Zealand)', 'en-ng': 'English (Nigeria)', 'en-ph': 'English (Philippines)', 'en-za': 'English (South Africa)', 'en-tz': 'English (Tanzania)', 'fr-ca': 'French (Canada)', 'fr-fr': 'French (France)', 'pt-br': 'Portuguese (Brazil)', 'pt-pt': 'Portuguese (Portugal)', 'es-es': 'Spanish (Spain)', 'es-us': 'Spanish (United States)'}

Văn bản ngoại tuyến để nói

Bây giờ bạn đã biết cách sử dụng API của Google, nhưng nếu bạn muốn sử dụng các công nghệ thành văn bản thành công nghệ ngoại tuyến thì sao?

Chà, thư viện PYTTSX3 đến giải cứu, nó là một văn bản để thư viện chuyển đổi lời nói trong Python, nó tìm kiếm các động cơ TTS được cài đặt sẵn trong nền tảng của bạn và sử dụng chúng, đây là bộ tổng hợp văn bản thành giọng nói mà thư viện này sử dụng:

SAPI5 trên Windows XP, Windows Vista, 8, 8.1 và 10
NSSpeechSynthesizer trên Mac OS X 10.5 và 10.6
Espeak trên Ubuntu Desktop Edition 8.10, 9.04 và 9.10

Dưới đây là các tính năng chính của thư viện PYTTSX3:pyttsx3 library:

Nó hoạt động hoàn toàn ngoại tuyến
Bạn có thể chọn trong số các giọng nói khác nhau được cài đặt trên hệ thống của bạn
Kiểm soát tốc độ của lời nói
Điều chỉnh khối lượng
Lưu âm thanh lời nói vào một tệp

Lưu ý: Nếu bạn đang ở trên hệ thống Linux và đầu ra thoại không hoạt động với thư viện này, thì bạn nên cài đặt Espeak, FFMPEG và LIBESPEAK1:: If you're on a Linux system and the voice output is not working with this library, then you should install espeak, FFmpeg and libespeak1:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

0

Để bắt đầu với thư viện này, hãy mở một tệp Python mới và nhập nó:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

1

Bây giờ chúng ta cần khởi tạo động cơ TTS:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

2

Bây giờ để chuyển đổi một số văn bản, chúng ta cần sử dụng các phương thức Say () và RunandWait ():say() and runAndWait() methods:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

3

Say () Phương thức thêm một cách nói để nói về hàng đợi sự kiện, trong khi phương thức RunandWait () chạy vòng lặp sự kiện thực tế cho đến khi tất cả các lệnh được xếp hàng. Vì vậy, bạn có thể gọi nhiều lần phương thức Say () và chạy một phương thức RunAndWait () duy nhất cuối cùng, để nghe tổng hợp, hãy thử nó! method adds an utterance to speak to the event queue, while runAndWait() method runs the actual event loop until all commands queued up. So you can call multiple times the say() method and run a single runAndWait() method in the end, in order to hear the synthesis, try it out!

Thư viện này cung cấp cho chúng tôi một số thuộc tính mà chúng tôi có thể điều chỉnh dựa trên nhu cầu của mình. Chẳng hạn, hãy lấy chi tiết về tỷ lệ nói:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

4

Output:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

5

Được rồi, chúng ta hãy thay đổi điều này thành 300 (làm cho tỷ lệ nói nhanh hơn nhiều):300 (make the speaking rate much faster):

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

6

Hoặc chậm hơn:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

7

Một thuộc tính hữu ích khác là Voices, cho phép chúng tôi nhận được chi tiết về tất cả các giọng nói có sẵn trên máy của bạn:voices, which allow us to get details of all voices available on your machine:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

8

Đây là đầu ra trong trường hợp của tôi:

The output of the above program should be a 
voice saying, 'Welcome to geeksforgeeks!'

9

Như bạn có thể thấy, máy của tôi có ba loa thoại, ví dụ: hãy sử dụng phần thứ hai, ví dụ:

pip3 install gTTS pyttsx3 playsound

0

Bạn cũng có thể lưu âm thanh dưới dạng tệp bằng phương thức

# save the audio file
tts.save("hello.mp3")

3, thay vì phát âm thanh bằng phương thức

# save the audio file
tts.save("hello.mp3")

4:

pip3 install gTTS pyttsx3 playsound

1

Một tập tin MP3 mới sẽ xuất hiện trong thư mục hiện tại, hãy kiểm tra nó!

Sự kết luận

Tuyệt vời, đó là hướng dẫn này, tôi hy vọng điều đó sẽ giúp bạn xây dựng ứng dụng của mình hoặc có thể là trợ lý ảo của riêng bạn trong Python.

Để kết luận, nếu bạn muốn sử dụng tổng hợp đáng tin cậy hơn, API của Google TTS là lựa chọn của bạn, nếu bạn chỉ muốn làm cho nó hoạt động nhanh hơn rất nhiều và không có kết nối internet, bạn nên sử dụng thư viện PYTTSX3.pyttsx3 library.

CẬP NHẬT: Tôi đã thực hiện một khóa học Skillshare nơi tôi đã tạo một trợ lý giọng nói AI với Python, chúng tôi đã sử dụng hầu hết các mã trên hướng dẫn này để sản xuất nó.: I have made a Skillshare course where I made an AI voice assistant with Python, we used most of the code on this tutorial to produce it.

Dưới đây là tài liệu cho cả hai thư viện:

GTT (Google Text-to-Speech)
PYTTTSX3-Text-to-Speech X-plat

Cuối cùng, nếu bạn là người mới bắt đầu và muốn học Python, tôi khuyên bạn nên tham gia khóa học & nbsp; Python cho mọi người Coursera, trong đó bạn sẽ tìm hiểu rất nhiều về Python. Bạn cũng có thể kiểm tra trang & NBSP; Tài nguyên và khóa học của chúng tôi & nbsp; để xem tài nguyên Python tôi đề xuất!

Liên quan: & nbsp; Cách phát và ghi âm thanh trong Python.How to Play and Record Audio in Python.

Happy Coding ♥

Xem Chế độ xem mã đầy đủ trên SkillShare

View on Skillshare

Cũng đọc

Bảng bình luận

Làm thế nào để bạn thay đổi văn bản thành bài phát biểu trong Python?

Có một số API có sẵn để chuyển đổi văn bản thành bài phát biểu trong Python.Một trong những API như vậy là API văn bản Google cho bài phát biểu thường được gọi là API GTTS.GTTS là một công cụ rất dễ sử dụng, chuyển đổi văn bản được nhập, thành âm thanh có thể được lưu dưới dạng tệp MP3.Google Text to Speech API commonly known as the gTTS API. gTTS is a very easy to use tool which converts the text entered, into audio which can be saved as a mp3 file.

Làm cách nào để chuyển đổi văn bản thành bài phát biểu?

Có nhiều công cụ trực tuyến mà bạn có thể sử dụng để chuyển đổi văn bản sang giọng nói ...

Text Wideo để nói ..

ttsreader..

ispeech..

Naturalreaders..

Làm cách nào để sử dụng Google Text để phát biểu trong Python?

Sử dụng API văn bản thành giọng nói với Python..

Overview..

Thiết lập và yêu cầu ..

Bật API ..

Xác thực các yêu cầu API ..

Cài đặt thư viện máy khách ..

Bắt đầu Python tương tác ..

Danh sách các ngôn ngữ được hỗ trợ ..

Danh sách các giọng nói có sẵn ..

Làm thế nào để bạn thực hiện nhận dạng giọng nói trăn?

Nhận dạng các từ nói pyaudio - nó có thể được cài đặt bằng cách sử dụng lệnh pip install pyaudio.Bài phát biểu nhận thức - Gói này có thể được cài đặt bằng cách sử dụng PIP InstallingRec nhận thức.Google-Speech-API-Nó có thể được cài đặt bằng cách sử dụng lệnh PIP cài đặt Google-API-Python-client.Pyaudio − It can be installed by using pip install Pyaudio command. SpeechRecognition − This package can be installed by using pip install SpeechRecognition. Google-Speech-API − It can be installed by using the command pip install google-api-python-client.

programming python Gtts Speech recognition Python Gtts Python