FFmpeg으로 영상 데이터 음성 변환 (MP4 to WAV)

오늘은 어제 크롤링한 영상 데이터를 음성 데이터로 변환해보겠습니다.

웹 크롤링 과정은 아래 글에 있습니다 !

[Data preprocessing] 웹 크롤링을 통한 데이터 수집 (Selenium) / NoSuchElementException

머신러닝을 위한 음성 데이터 수집을 위해 웹 크롤링을 진행하였습니다. 크롬에서 크롤링을 진행할 것이기 때문에 크롤링 전에 크롬 드라이버를 설치하고 가상환경에 셀레니움을 설치하였습

seulow-down.tistory.com

음성 데이터에서 STT를 사용해서 텍스트로 변환할 것이기 때문에 FFmpeg를 통해서 mp4를 wav로 변환하려고 합니다.

먼저 FFmpeg를 설치한 후, ffmpeg-python을 사용하여 아래의 코드로 변환 가능합니다.

import os
import ffmpeg

input_folder = r"영상 파일 경로\영상파일명"
output_folder = r"음성 파일 저장할 파일 경로"

file_list = sorted(os.listdir(input_folder), key=lambda x: int(x.split('.')[0])) # 영상파일명 번호대로 정렬

for file_name in file_list:
    if file_name.endswith(".mp4"):
        input_file = os.path.join(input_folder, file_name)
        output_file = os.path.join(output_folder, file_name.replace(".mp4", ".wav"))

        try:
            ffmpeg.input(input_file).output(output_file).run()
            print(f"변환 완료: {input_file} -> {output_file}")
        except ffmpeg.Error as e:
            print(f"오류 발생: {e}")

print("모든 파일 변환 완료!")

'개발 | 프로젝트' 카테고리의 다른 글

Few-Shot Learning 감정 분석 예시 (0)	2025.03.17
KoBERT 모델 (0)	2025.03.13
Whisper로 STT(Speech-To-Text) 구현하기 (2)	2025.03.07
[Spring] MVC 동작 구조 (0)	2025.02.15
Node.js, Unity WebSocket 통신 (+ 에러 해결) (0)	2025.02.13

'개발 | 프로젝트' 카테고리의 다른 글

티스토리툴바