[PYTHON/OPENAI] OpenAI 클래스 : audio 변수를 사용해 한국어 음성 파일을 한글 텍스트로 변환하기

icodebroker OPENAI 2024-06-18

■ OpenAI 클래스의 audio 변수를 사용해 한국어 음성 파일을 한글 텍스트로 변환하는 방법을 보여준다.

▶ main.py


import os

from openai import OpenAI

os.environ["OPENAI_API_KEY"] = "<OPENAI_API_KEY>"

openAI = OpenAI()

audioFilePath = open("audio.mp3", "rb")

transcription = openAI.audio.transcriptions.create(
    model = "whisper-1",
    file  = audioFilePath
)

print(transcription)

"""
Transcription(
    text = 'Whisper는 범위온 음성인식 모델입니다. 다양한 오디오의 대규모 데이터 시트를 학습하고 다국어 음성인식, 음성번역, 언어식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다.'
)
"""

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

import os

from openai import OpenAI

os.environ["OPENAI_API_KEY"] = "<OPENAI_API_KEY>"

openAI = OpenAI()

audioFilePath = open("audio.mp3", "rb")

transcription = openAI.audio.transcriptions.create(

model = "whisper-1",

file = audioFilePath

)

print(transcription)

"""

Transcription(

text = 'Whisper는 범위온 음성인식 모델입니다. 다양한 오디오의 대규모 데이터 시트를 학습하고 다국어 음성인식, 음성번역, 언어식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다.'

)

"""

▶ requirements.txt


annotated-types==0.7.0
anyio==4.4.0
certifi==2024.6.2
distro==1.9.0
exceptiongroup==1.2.1
h11==0.14.0
httpcore==1.0.5
httpx==0.27.0
idna==3.7
openai==1.31.1
pydantic==2.7.3
pydantic_core==2.18.4
sniffio==1.3.1
tqdm==4.66.4
typing_extensions==4.12.1

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

annotated-types==0.7.0

anyio==4.4.0

certifi==2024.6.2

distro==1.9.0

exceptiongroup==1.2.1

h11==0.14.0

httpcore==1.0.5

httpx==0.27.0

idna==3.7

openai==1.31.1

pydantic==2.7.3

pydantic_core==2.18.4

sniffio==1.3.1

tqdm==4.66.4

typing_extensions==4.12.1

audio.zip

Post Views: 2

AI AUDIO LLM OPENAI PYTHON

icodebroker

[PYTHON/OPENAI] OpenAI 클래스 : audio 변수를 사용해 한국어 음성 파일을 한글 텍스트로 변환하기

분류

보관함