Releases: rerender2021/echo
Releases · rerender2021/echo
Release 1.2.0
Release preview: custom port
更新内容
- #13: 支持自定义端口。
更新方式
- 下载附件中的 echo-vosk-port.zip(调试则用 echo-vosk-port-debug.zip)
- 更新 asr-server 到 1.2.0:https://github.com/rerender2021/ASR-API/releases/tag/1.2.0
首次运行会在 exe 同级目录生成 config.json
,在其中这样配置端口:
{
"timeout": 3500,
"asrPort": 8222,
"asrSocketPort": 8333,
"nlpPort": 8111
}
Release 1.1.0
更新内容
Release preview: use gpu
更新内容
- 语音识别:标点恢复更换模型,速度大幅提升(采用 ASR-API v1.1.0)
- 离线翻译支持使用gpu(需要cuda环境)(采用 NLP-GPU-API v1.0.0)
- 支持长句分解、字幕相关自定义设置
之前的版本,对于演讲之类语速慢的视频来说,就还行。但是对于一些语速较快的视频,就不行了。
另外,综合下来,cpu占用,本机测试大概40~50%左右,不会再疯狂旋转。
演示
以下演示此次更新后,看语速较快视频的情况:(以下视频默认是静音的,需要自己点一下打开声音)
output.mp4
以及另外一例:
https://www.bilibili.com/video/BV1ks411J7Vn/?p=2&spm_id_from=pageDriver
output-2.mp4
安装
- 下载文末附件 echo-use-gpu.zip 并解压缩
- 语音识别:下载并解压缩:https://github.com/rerender2021/ASR-API/releases/download/1.1.0/asr-server-v1.1.0.zip
- 离线翻译:
- 下载链接中的2个压缩分卷并解压缩(文件太大,只能分卷压缩上传):https://github.com/rerender2021/NLP-GPU-API/releases/tag/1.0.0
- 安装cuda环境:注意版本:11.7:https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Windows&target_arch=x86_64
- 验证cuda安装成功:命令行输入nvcc -V,看输出:
Copyright (c) 2005-2022 NVIDIA Corporation Built on Tue_May__3_19:00:59_Pacific_Daylight_Time_2022 Cuda compilation tools, release 11.7, V11.7.64 Build cuda_11.7.r11.7/compiler.31294372_0
运行
下载的东西解压缩后,预期目录结构:
- nlp-gpu-server
- ...其它文件
- NLP-GPU-API.exe
- asr-server-v1.1.0
- ...其它文件
- ASR-API.exe
- echo-use-gpu.exe
- 双击echo-use-gpu.exe运行
- 注意窗口标题是不是 Echo(GPU),以此判断是否成功使用GPU
Release preview: stable sentence
尝试优化断句问题,以及添加字幕相关自定义设置:字体大小,中英切换
2023-03-18-08-52-34-stable-sentence.mp4
Release 1.0.0
简介
发布回声(Echo)1.0.0,软件首页:https://rerender2021.github.io/products/echo/
- 下载 echo-v1.0.0.zip (740M+) 后 双击exe 即可运行
- echo-v.1.0.0-exe.zip:仅用于自行扩展
- echo-v.1.0.0-debug-exe.zip: 仅用于问题排查