當我發現如何在 Python 中執行文本到語音轉換時,我想知道如何將其應用到一個有用的研究案例中。然後,我記得我經常訪問 Wikipedia 頁面,這些頁面涉及我感興趣的主題,但其中包含很多我不想完全閱讀的文本。我寧願在做其他事情的同時聽那些頁面的內容。
因此,我決定使用 Python 將 Wikipedia 頁面轉換為音頻文件。
讓我們首先為此任務導入有用的包。我將使用的庫是用於抓取部分的bs4和requests ,用於正則表達式的re ,以及用於文本轉語音部分的pyttsx3 。
from bs4 import BeautifulSoup
import requests
import re
import pyttsx3 as tts
對於抓取部分,我們只需要定義一個 URL 並從相應的網頁中檢索文本。
url = "https://en.wikipedia.org/wiki/Wikipedia" #the web page you want to scrape
# Collecting data from the web page
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data, "lxml")
我們希望僅保留文本。因此,我們只尋找段落元素。
paragraphs = soup.findAll("p")
如果您打印可變段落,您將看到一個列表,其中包含使用可變URL訪問的網頁中的所有段落元素。
當我們將文本轉換為語音