Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Whisper API Transcription failed Connection error #291

Open
huongng105 opened this issue Jan 30, 2025 · 2 comments
Open

Whisper API Transcription failed Connection error #291

huongng105 opened this issue Jan 30, 2025 · 2 comments
Labels
bug Something isn't working

Comments

@huongng105
Copy link

问题描述 | Problem Description

我正在使用 VideoCaptioner 在 MacBook M4 Pro 上进行视频字幕生成。我已经按照截图中的设置配置了 Whisper API,并使用了 DeepSeek 的 API Key 和 Base URL。然而,当我尝试进行语音转录时,遇到了连接错误,转录失败。

我的配置:

API Key: 已输入 DeepSeek 的 API Key

Base URL: https://api.deepseek.com/v1

Model: deepseek-chat

Whisper 模型: whisper-large-v3

源语言: 中文

问题:

我已经检查了 API 连接,显示连接成功,但在实际转录时仍然失败。

请问是否有其他配置需要注意,或者这是否是一个已知的问题?

希望得到您的帮助,谢谢!

Image Image Image Image

日志信息(可选)| Logs (Optional)

@huongng105 huongng105 added the bug Something isn't working label Jan 30, 2025
@philpw99
Copy link

philpw99 commented Jan 30, 2025

老兄,DeepSeek 的 API 不是 Whisper API,就好像你想让DeepSeek V3 画个图,可它就光会说,画不出来啊。
DeepSeek 的作用是之后的断句,优化 和 翻译,而不是用来音频转文字的。

你需要自己找一个支持 Whisper API 的网站,特点是它会支持 “/v1/audio/transcriptions” 的节点,而不是一般的 "v1/chat/completions"。
目前为止我能找到支持 Whisper API 的地方

  1. OpenAI 的官网
  2. https://whisperapi.com/
  3. https://github.com/speaches-ai/speaches ,可以本地安装,功能很强,设定也多。用 Docker 安装会容易一点
    https://speaches-ai.github.io/speaches/installation/#__tabbed_2_1
  4. https://github.com/matatonic/openedai-whisper 这个看来比较简单

@huongng105
Copy link
Author

Brother, DeepSeek's API is not the Whisper API, as if you want Deepseek V3 to draw a picture, but it will just say that it cannot be drawn.老兄,DeepSeek 的 API 不是 Whisper API,就好像你想让DeepSeek V3 画个图,可它就光会说,画不出来啊。The role of DeepSeek is later discourse, optimization and translation, not for audio to text. DeepSeek 的作用是之后的断句,优化 和 翻译,而不是用来音频转文字的。

You need to find a website that supports Whisper A., ​​which is characterized by nodes that support "/V1/Audio/Transcriptions", not the general "V1/Chat/Completions".你需要自己找一个支持 Whisper API 的网站,特点是它会支持 “/v1/audio/transcriptions” 的节点,而不是一般的 "v1/chat/completions"。So far I can find a place to support WHISPER API 目前为止我能找到支持 Whisper API 的地方

  1. Openai's website  OpenAI 的官网
  2. https://whisperapi.com/
  3. https://github.com/speaches- ai/ speaches can be installed locally. It has a strong function and more settings. It will be easier to install with dockerhttps://github.com/speaches-ai/speaches ,可以本地安装,功能很强,设定也多。用 Docker 安装会容易一点
    https://speaches-ai.github.io/speaches/installation/#__tabbed_2_1
  4. HTTPS://github.com/ ுatonic/openewinee-wor 这个看来比较简单https://github.com/matatonic/openedai-whisper 这个看来比较简单

谢谢你的解答和分享! 确实,我之前没有注意到 DeepSeek 主要是做文本优化、翻译,而不是 Whisper API。你的信息对我帮助很大,特别是提供了一些可以使用 Whisper API 的网站,真的太感谢了!我会去试试这些资源,希望能顺利找到适合的方案。再次感谢你的耐心解答!🚀

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants