오늘은 어제 크롤링한 영상 데이터를 음성 데이터로 변환해보겠습니다.
웹 크롤링 과정은 아래 글에 있습니다 !
[Data preprocessing] 웹 크롤링을 통한 데이터 수집 (Selenium) / NoSuchElementException
머신러닝을 위한 음성 데이터 수집을 위해 웹 크롤링을 진행하였습니다. 크롬에서 크롤링을 진행할 것이기 때문에 크롤링 전에 크롬 드라이버를 설치하고 가상환경에 셀레니움을 설치하였습
seulow-down.tistory.com
음성 데이터에서 STT를 사용해서 텍스트로 변환할 것이기 때문에 FFmpeg를 통해서 mp4를 wav로 변환하려고 합니다.
먼저 FFmpeg를 설치한 후, ffmpeg-python을 사용하여 아래의 코드로 변환 가능합니다.
import os
import ffmpeg
input_folder = r"영상 파일 경로\영상파일명"
output_folder = r"음성 파일 저장할 파일 경로"
file_list = sorted(os.listdir(input_folder), key=lambda x: int(x.split('.')[0])) # 영상파일명 번호대로 정렬
for file_name in file_list:
if file_name.endswith(".mp4"):
input_file = os.path.join(input_folder, file_name)
output_file = os.path.join(output_folder, file_name.replace(".mp4", ".wav"))
try:
ffmpeg.input(input_file).output(output_file).run()
print(f"변환 완료: {input_file} -> {output_file}")
except ffmpeg.Error as e:
print(f"오류 발생: {e}")
print("모든 파일 변환 완료!")
'개발 | 프로젝트' 카테고리의 다른 글
Few-Shot Learning 감정 분석 예시 (0) | 2025.03.17 |
---|---|
KoBERT 모델 (0) | 2025.03.13 |
Whisper로 STT(Speech-To-Text) 구현하기 (2) | 2025.03.07 |
[Spring] MVC 동작 구조 (0) | 2025.02.15 |
Node.js, Unity WebSocket 통신 (+ 에러 해결) (0) | 2025.02.13 |