coco 发表于 2023-3-15 13:01:55

刚研究视频转文字的时候,发现个有意思的东西,英文部分是openai的whisper

刚研究视频转文字的时候,发现个有意思的东西,英文部分是openai的whisper返回的,中文部分是3.5翻译过来的。音频的识别竟然主要都是英文,我之前以为是直接识别中文发音的,中文发音直接识别成英文,好奇怪。
非会员试读19%,加入社区后可阅读全文

小金子依依 发表于 2023-3-15 14:35:19

怎么做到的视频转文字?

coco 发表于 2023-3-15 14:39:31

python调用ffmpeg先把视频转音频,再用whisper把音频转文字

ttyml 发表于 2023-5-11 17:02:43

uu,mj[流泪][流泪]
页: [1]
查看完整版本: 刚研究视频转文字的时候,发现个有意思的东西,英文部分是openai的whisper