Skip to content

Releases: WEIFENG2333/VideoCaptioner

VideoCaptioner v1.3.2

09 Feb 06:21
Compare
Choose a tag to compare

避免一些小白混淆,优化了一些命名。
提供日志翻译和优化、分割的日志。

VideoCaptioner v1.3.1

08 Feb 07:54
Compare
Choose a tag to compare

🔧 问题修复

翻译功能优化

  • 修复谷歌翻译服务语言选择不正确的问题
  • 修复微软翻译服务准确性问题,提升翻译质量

系统兼容性改进

  • 修复在未选择 CUDA 设备时出现的 WinError 报错问题
  • 优化设备选择逻辑,提升程序稳定性

字幕处理优化

  • 修复视频字幕合成失败的问题
  • 修复 ASS 格式单语字幕内容缺失的问题

💡 使用建议

  1. 建议所有用户升级到此版本以获得更稳定的体验
  2. 如果您在使用过程中遇到任何问题,欢迎在 GitHub 上提交 Issue

📥 下载地址

Windows 用户可以通过以下方式下载:

  • [GitHub Release] 下载 VideoCaptioner-Setup-win64-v1.3.1.exe
  • 蓝奏云盘:点击下载

🙏 致谢

感谢社区用户的反馈,帮助我们不断改进软件质量!


如果您觉得这个项目对您有帮助,欢迎给我们一个 Star ⭐️

VideoCaptioner v1.3.0 重磅发布!🎉🎉🎉

07 Feb 10:40
Compare
Choose a tag to compare

经过一段时间的代码重构与优化,我很高兴地宣布 VideoCaptioner v1.3.0 正式发布!

此版本带来了许多改进

🚀 核心功能增强

  • 代码架构重构:对代码进行了完整的重构,优化了整体性能。
  • 模块分离:字幕优化与翻译功能分离,您可以更灵活地选择处理选项。
  • 批量处理:新增批量处理功能,支持批量字幕批量转录批量字幕视频合成
  • UI 优化:全面优化了 UI 界面与交互细节,带来更便捷的体验。

🤖 多种优化与升级

  • 扩展 LLM 支持:新增对以下 LLM 模型支持,为您提供更多选择:
    • SiliconCloud
    • DeepSeek
    • Ollama
    • Gemini
    • ChatGLM
  • 集成多种翻译服务
    • DeepLx
    • Bing
    • Google
    • LLM
  • 新增模型支持:新增 faster-whisper-large-v3-turbo 模型支持。
  • 多种 VAD 方法:新增多种 VAD(语音活动检测)方法,提高语音识别准确性。
  • 自定义反思翻译:支持自定义反思翻译开关,您可以根据需要开启或关闭此功能。
  • 字幕断句优化
    • 支持语义/句子两种断句模式。
    • 优化断句、优化、翻译提示词。
  • 缓存机制优化优化字幕、转录缓存机制,提高处理速度。
  • 新增中文字幕自动换行功能,使字幕更美观。
  • 新增竖屏字幕样式。
  • 改进字幕时间轴切换,消除闪烁问题。
  • 新增日志文件打开功能。
  • 新增泰语、德语等语言的字幕优化。
  • 新增多种字幕视频格式支持。
  • 优化输出视频工作目录结构。

🐛 Bug 修复与其他改进

  • 修复 Whisper API 无法使用问题。
  • 修复部分情况转录错误的问题。
  • 修复诸多其他 Bug...

📥 获取方式

您也可以通过以下链接下载 VideoCaptioner v1.3.0:

蓝奏网盘

🙏 感谢

感谢所有为 VideoCaptioner 做出贡献的开发者和用户!

如果您在使用过程中遇到任何问题或有任何建议,请随时在 GitHub 上提出 Issue 或 Pull Request。

VideoCaptioner v1.2.0

07 Dec 15:15
Compare
Choose a tag to compare

2024年12月8日发布更新:

✨ 新功能

  • 新增 Faster-whisper 支持,提供更高质量的音频转字幕功能 强烈建议使用!!
  • 新增 VAD 语音活动检测,显著减少字幕幻觉现象
  • 新增人声分离功能,可有效去除视频背景噪音
  • 新增开关单词时间戳生成选项
  • 新增关闭视频合成选项
  • 新增字幕最大长度设置
  • 新增字幕末尾标点去除设置

🔧 优化改进

  • 优化字幕优化和翻译的提示词
  • 优化 LLM 字幕断句逻辑,提升断句准确性
  • 优化音频转换格式一致性

🐛 问题修复

  • 修复进程泄露问题 (#83)
  • 修复断句时 eng_seg_index 变量错误 (#71)
  • 修复音频转换格式不一致问题 (#104)
  • 修复其他导致闪退的问题 (#78)
  • 移除Cpp不稳定的 Whisper-v3 支持 (#93, #64)

📥 下载

Windows 用户可以通过以下方式下载:

  • [GitHub Release] 选择 VideoCaptioner-Setup-win64-v1.2.0.exe 进行下载
  • 蓝奏云盘

📝 注意事项

  • 本次更新优化了音频处理流程,建议更新到最新版本

感谢各位用户的反馈和建议!

VideoCaptioner v1.1.1

24 Nov 04:37
Compare
Choose a tag to compare

2024年11月24日发布更新:

临时修复管理员权限不足导致路径创建错误的问题
修复whisper转录过程错误的问题

✨ 新功能

  • 新增 Whisper-v3 模型支持
  • 新增 Whisper API 调用功能
  • 软件主页支持查看软件相关的日志
  • 支持查看字幕优化和反思翻译的日志
  • 支持双语/单语字幕导出选择 (#15)
  • 支持文稿匹配提示对齐功能 (#47)
  • 支持自定义调节字幕位置 (#23)
  • 支持导入 cookie.txt 以绕过 Youtube 验证及下载其他网站高清视频 (#9)
  • 字幕文件名现与视频文件名保持一致 (#7)

🐛 问题修复

  • 修复字幕导入时的闪退问题 (#16)
  • 优化字幕断句效果 (#20)
  • 优化视频工作目录的文件排布结构 (#7
  • 修复检测模型可用性时的闪退问题 (#43)
  • 修复下载模型时非中文路径报错问题 (#13)
  • 修复使用 API 时自动翻译的问题 (#10)
  • 修复软件内一些功能不统一的问题
  • 优化字幕断句的效果

为了后续更新的方便,新版本使用安装包的形式,以往压缩包的版本不再使用,用户可以直接删除之前的版本。(如果不想再次下载模型请先进行备份)

也可以通过蓝奏网盘下载安装包:https://wwwm.lanzoue.com/iR8Tp2g2bzli

VideoCaptioner v1.1.0

23 Nov 14:46
Compare
Choose a tag to compare

VideoCaptioner v1.1.0

2024年11月23日发布更新:

✨ 新功能

  • 新增 Whisper-v3 模型支持
  • 新增 Whisper API 调用功能
  • 软件主页支持查看软件相关的日志
  • 支持查看字幕优化和反思翻译的日志
  • 支持双语/单语字幕导出选择 (#15)
  • 支持文稿匹配提示对齐功能 (#47)
  • 支持自定义调节字幕位置 (#23)
  • 支持导入 cookie.txt 以绕过 Youtube 验证及下载其他网站高清视频 (#9)
  • 字幕文件名现与视频文件名保持一致 (#7)

🐛 问题修复

  • 修复字幕导入时的闪退问题 (#16)
  • 优化字幕断句效果 (#20)
  • 优化视频工作目录的文件排布结构 (#7
  • 修复检测模型可用性时的闪退问题 (#43)
  • 修复下载模型时非中文路径报错问题 (#13)
  • 修复使用 API 时自动翻译的问题 (#10)
  • 修复软件内一些功能不统一的问题
  • 优化字幕断句的效果

为了后续更新的方便,新版本使用安装包的形式,以往压缩包的版本不再使用,用户可以直接删除之前的版本。(如果不想再次下载模型请先进行备份)

也可以通过蓝奏网盘下载安装包:https://wwwm.lanzoue.com/iKMhH2g0se9a

VideoCaptioner v1.0.0

12 Nov 16:40
Compare
Choose a tag to compare

🎉 首个正式版本发布!

✨很高兴发布 VideoCaptioner v1.0.0 版本。这是一款基于大语言模型的智能视频字幕处理助手,支持字幕生成、断句、优化、翻译等全流程处理。

程序不知道会有一丢丢我没发现的BUG,如果遇到欢迎提出。

📥 下载

  • Windows用户:

    • 下载 VideoCaptioner-win-v1.0.0.7z
    • 解压后运行 VideoCaptioner.exe
  • MacOS用户:

    • 请参考项目README进行源码安装

📋 使用说明

  1. 运行程序后可直接拖拽视频文件进行处理
  2. 可选配置LLM API以获得更好的优化效果
  3. 支持自定义字幕样式和排版方式

📝 反馈

目前还要兼顾学业,维护可能会稍缓,但是欢迎如有任何问题或建议,欢迎在GitHub提交 Issue

感谢支持!