查看 53 回复 4

[本站原创]SubtitleOCR字幕工具 v1.1.3 --图形字幕OCR识别,支持百度云、千问VL-OCR和Google Gemini

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:134
  • 打卡月天数:2
  • 打卡总奖励:243
  • 最近打卡:2026-06-03 15:21:49

830

主题

119

回帖

5388

影币

YzYY工作组

积分
807

1周年纪念2周年纪念

发表于 2026-4-2 21:46:59|来自:台湾台北 | 显示全部楼层 |阅读模式
基本信息
软件版本(Software type): 免费正版(Free genuine version) 
界面语言(UI Language): 简体 
使用平台(Usage Platform): Windows, 
使用方式(Usage of software): 免安装(Installation-free)
资源体积(Size): (169MB)
网盘(Storage Network Drive): 115 123 百度 
分享说明(Say something): 本工具终身免费!
但是要下载你得花费100影币。
一句话总结使用方法:模式一加载字幕后直接OCR识别;模式二加载字幕后需要点一下“提取图片”。
两个模式的机制不同,喜欢哪个就用哪个。
SubtitleOCR字幕工具 保姆级使用教程

═══════════════════════════════════════════════
一、前言

本工具全称 SubtitleOCR 字幕工具·整合版,由 慕静安 开发(网站:www.yzyy.org)。它是一款 绿色单文件 字幕处理工具,集成了两种工作模式,支持 百度云OCR千问VL-OCRGoogle Gemini(v1.1.3版本新增 )三大云端识别引擎,无需本地安装任何 OCR 程序。

特别适合以下场景:
  • 处理 Blu-ray 光盘提取的 SUP 格式字幕和从DVD提取的sub+idx格式字幕。
  • 字幕文字模糊、嵌入图片,需要 OCR 重新识别
  • 批量处理大量字幕文件
  • 精细校对双语字幕的换行符位置

主界面.png
(截图位置1:程序主界面全貌,窗口大小约 1400x900,包含工具栏和模式一表格)

═══════════════════════════════════════════════


二、安装与启动


2.1 下载与解压

下载压缩包 SubtitleOCR_v113_Portable.zip,解压到任意位置即可使用。注意路径中 不要包含中文和空格,建议直接放在桌面或 D 盘根目录。

文件夹结构如下:
SubtitleOCRTool_v113.exe主程序(双击运行)
启动程序.bat带 Java 检测的启动脚本(初次推荐使用)
BDSup2Sub.jarBlu-ray SUP 字幕转换工具(可选)
Java/Java 运行时环境(可选,如处理 SUP 字幕需安装)
logs/日志目录,程序运行后自动创建
README.md使用说明


2.2 启动方式

方式一(初次推荐):双击 启动程序.bat
方式二:双击 SubtitleOCRTool_v113.exe

首次使用 Blu-ray SUP 字幕功能时,脚本会提示安装 Java。

检测Java环境.png
(截图位置2:双击"启动程序.bat"后的弹窗,提示"Java 检测中..."或"Java 已就绪")

═══════════════════════════════════════════════


三、界面布局总览
各种标记.png
(截图位置3:标注各区域名称的界面截图)

区域说明
① 模式切换切换"模式一"和"模式二"
② 工具栏打开字幕、OCR引擎选择、字号调节、API设置、开始OCR、导出SRT等
③ 主表格显示字幕内容的核心区域
④ 状态栏显示当前状态和日志路径


═══════════════════════════════════════════════


四、OCR 引擎配置(必须先完成)

重要提示:在开始 OCR 识别之前,必须先配置至少一个 OCR 引擎的 API 密钥,否则所有 OCR 功能都无法使用。

4.1 点击工具栏的"API设置"按钮


点击后,工具栏下方会展开 API 设置面板:
API.png
(截图位置5:展开后的API设置面板,包含OCR引擎选择、AK/SK/Key输入框)

4.2 选择 OCR 引擎

在 OCR 下拉框中选择 百度云OCR千问VL Google Gemini

引擎需要的密钥申请地址
百度云OCRAPI Key(AK)和 Secret Key(SK)百度智能云控制台 console.bce.baidu.com
千问VLDashScope Key阿里云百炼平台 dashscope.console.aliyun.com
Google AI StudioAPI KeyGoogle Gemini aistudio.google.com/apikey


4.3 填写密钥并保存

百度云 OCR 配置步骤:
  • 在百度智能云注册并登录
  • 进入"安全认证"创建 Access Key,获得 AK 和 SK
  • 将 AK 填入"百度 AK"输入框
  • 将 SK 填入"百度 SK"输入框


千问 VL-OCR 配置步骤:
  • 在阿里云百炼平台注册并登录
  • 开通"视觉理解"服务创建
  • 获取 DashScope API Key
  • 将 Key 填入"千问 DashScope Key"输入框


Google Gemini  配置步骤:
  • 在Google AI Studio平台注册并登录
  • 创建或选择一个项目
  • Get API Key
  • 将 Key 填入"Gemini Key"输入框


密钥填写完成后,程序会 自动保存,下次启动时自动恢复,无需重复填写。

4.4 验证密钥是否有效

配置好密钥后,可以直接尝试加载一个字幕文件,然后点击"开始OCR"。如果提示"百度云认证失败"或"千问 Key 无效",说明密钥有误,请检查填写是否正确。

百度云认证失败.png
(截图位置6:认证失败的错误弹窗)

═══════════════════════════════════════════════


五、字幕文件加载


点击工具栏的 打开字幕 按钮,选择需要处理的字幕文件。

支持加载的文件格式:
  • Blu-ray SUP:蓝光碟提取的字幕(.sup),需要 Java 环境
  • VobSub(SUB/IDX):DVD 提取的字幕格式(需 .sub 和 .idx 成对存在)


注意:本工具专为图片型字幕设计,用于对嵌入图片进行 OCR 识别。不支持纯文字型字幕(如 SRT、ASS、SSA)。加载字幕后,工具栏上的"开始OCR"按钮会变为可用状态。如果按钮仍然是灰色,请检查 OCR 引擎密钥是否已配置。
打开字幕对话框.png
(截图位置7:"打开字幕"对话框,筛选器显示支持的格式)

═══════════════════════════════════════════════


六、模式一:表格编辑模式

6.1 适用场景

模式一是 精细校对模式,适合以下情况:
  • 字幕量不多,需要逐条认真校对
  • 需要精确调整每条字幕的换行符位置
  • 需要频繁使用"查找替换"功能
  • 只需要对部分字幕进行 OCR,其余手动编辑


6.2 表格列说明
认证成功.png
(截图位置8:模式一加载字幕后的表格全貌,标注各列名称)

列名说明可编辑
序号字幕条目的序号(1, 2, 3...)
开始时间字幕开始时间(HH:MM:SS,mmm)
结束时间字幕结束时间
时长该条字幕的持续时长(计算得出)
图片字幕对应的图像预览缩略图
校对可编辑的文字内容,即最终导出内容


小提示:对于 VobSub 格式字幕,程序会自动提取嵌入的图片并显示在该列;如果没有图片,则显示为空白。

6.3 右键菜单功能

在表格任意位置右键点击,会弹出快捷菜单:
QQ20260408-231857.png
(截图位置9:模式一右键菜单截图)

菜单项功能说明
↩ 插入换行符 //在当前行末尾插入双斜线分隔符(用于标注双行字幕时的换行位置)
清空校对文字将校对列清空
插入单音符在字幕开头插入音符
插入双音符在字幕首尾分别插入音符
删除音符在已经插入音符的字幕上再次点击插入音符,即可删除




6.4 在校对列编辑状态下插入 //

重要新功能(v1.0.9):双击校对列的单元格进入编辑模式后,在编辑状态下右键点击,同样会弹出自定义中文菜单,第一项就是"↩ 插入换行符 //"。
右键菜单.jpg
(截图位置10:双击进入编辑模式后,右键菜单显示自定义内容,含"插入换行符 //"选项)

如果选中了部分文字,点击"插入换行符 //"会将选中文本替换为" //";如果没有选中文本,则在光标位置插入" //"。

6.5 单条 OCR

如果只需要对某一条字幕进行识别,可以:
  • 在表格中选中该行
  • 右键点击,选择"OCR 识别(当前条)"


该功能无需提取全部图片,响应更快,适合少量修正。

6.6 查找替换

右键选择"查找..."或"替换...",弹出对话框:
查找替换.png
(截图位置11:查找替换对话框截图)

对话框字段说明
查找内容输入要搜索的文字
替换为输入替换后的文字
区分大小写勾选后区分大小写
区分全半角勾选后区分全角和半角字符


点击"查找下一个"高亮定位,点击"全部替换"批量处理。

6.7 字体大小调节

工具栏右侧有字号下拉框,可以调整表格内文字的大小(10~20pt),默认12pt。此设置只影响校对列,不影响时间戳和小标题显示。
QQ20260402-203209.png
(截图位置12:字号下拉框的位置和可选字号列表)

═══════════════════════════════════════════════


七、模式二:批量OCR模式


7.1 适用场景

模式二是 效率优先模式,适合以下情况:
  • 字幕量大,需要快速批量处理
  • 所有字幕都需要 OCR 识别
  • 希望一键完成提取图片+OCR+填入表格


7.2 表格列说明
模式二.png
(截图位置13:模式二加载字幕后的表格全貌,6列布局)

列名说明
序号字幕条目序号
开始时间开始时间戳
结束时间结束时间戳
时长持续时长
图片字幕图片预览(可拖拽调整列宽)
校对OCR 识别结果,双击可编辑


7.3 工作流程

第一步:切换到模式二

点击"模式二"单选按钮,界面会切换到模式二的表格布局。
提取图片.png
(截图位置14:切换到模式二后,工具栏多出"提取图片"按钮)

第二步:点击"提取图片"

点击后,程序会从字幕文件中批量提取所有嵌入的图片。进度条会显示提取进度:
正在提取图片.png
(截图位置15:提取图片进度条,显示"正在提取图片... X%")

提取完成后,图片列会自动填充缩略图,表格变为6列完整状态。此时"开始OCR"按钮变为可用状态。

第三步:点击"开始OCR"

程序会依次对所有图片进行 OCR 识别。识别过程中:
  • 进度条显示整体进度(批量OCR)
  • 表格中每条字幕的"校对"列会实时显示识别结果
  • 千问引擎每识别10条会休息3秒,防止接口限流

批量OCR.png
(截图位置16:批量OCR进行中的截图,进度条在某百分比,校对列已有文字填充)

OCR 完成后,弹出提示框"OCR 批量识别完成!"。

7.4 识别结果修正

批量 OCR 完成后,如果发现某条识别结果不准确:
  • 双击该行的"校对"列,直接编辑文字
  • 在编辑状态下,右键可使用"插入换行符 //"功能(v1.0.9 新增)


7.5 再次提取图片(刷新)

如果加载字幕后想重新提取图片(字幕文件被外部修改过),直接再次点击"提取图片"即可覆盖。

═══════════════════════════════════════════════


八、关于 // 换行符的说明

8.1 什么是双斜线 //

很多双语字幕中,一行显示两句话,中间用 // 分隔,表示"上半行显示A,下半行显示B"。例如:

我在优秀的父母面前 // 默默接受了这一切

在 Subtitle Edit 中打开时,会显示为:
我在优秀的父母面前
默默接受了这一切


8.2 工具自动处理

OCR 引擎返回的图片如果是多行文字,程序会自动清理返回的换行符,并插入 // 作为双行分隔符。对于千问引擎,如果返回了 `// //` 这样的重复斜线,程序会自动合并为单个 //

8.3 手动插入 //

在模式一或模式二中,可以:
  • 右键菜单 → ↩ 插入换行符 //:在行末追加 //
  • 编辑模式下右键菜单 → ↩ 插入换行符 //:在光标处插入(或替换选中文本)


═══════════════════════════════════════════════


九、导出 SRT

完成所有校对后,点击工具栏的 导出SRT 按钮。
保存字幕.png
(截图位置17:导出SRT对话框)

对话框字段说明
保存位置默认保存在原字幕文件所在目录
文件名默认使用原字幕文件名,末尾自动加"_ocr"后缀


点击保存后,程序将校对列的文字按 SRT 格式输出(保留原时间轴),覆盖保存到指定位置。

重要:校对列有内容的行才导出,完全空白的行会被跳过。

═══════════════════════════════════════════════


十、 Blu-ray SUP 字幕特殊说明

如果需要处理 Blu-ray 光盘提取的 SUP 格式字幕:

第一步:安装 Java

SUP 字幕的解码依赖 BDSup2Sub.jar,该工具需要 Java 环境才能运行。

  • 运行"启动程序.bat",如果检测到未安装 Java,会提示下载
  • 点击提示中的下载链接,前往 java.com 下载并安装
  • 安装完成后重启电脑


第二步:加载 SUP 文件

点击"打开字幕",选择 .sup 文件。程序会自动调用 BDSup2Sub.jar 将其转换为 VobSub 格式,然后解码显示图片。

SUP 字幕处理流程:
步骤说明
1调用 BDSup2Sub.jar 转换为 VobSub
2程序内置 Python 解码器读取 VobSub
3提取 SPU 图像数据,渲染显示
4生成字幕条目列表


注意:如果程序目录中有 Java 文件夹(便携版自带),程序会优先使用自带的 Java,无需额外安装。如果未检测到 Java,则跳过 BDSup2Sub 转换,直接提示 SUP 解码失败。

(截图位置18:成功加载 SUP 字幕后的界面,显示 Blu-ray 格式识别成功)

═══════════════════════════════════════════════


十一、常见问题

Q1:提示"百度云认证失败"
A:请检查 AK 和 SK 是否填写正确,密钥是否有权限,建议到百度云控制台重新创建一对密钥再试。

Q2:提示"请填写百度云 API Key"
A:这是因为 OCR 引擎选择为"百度云OCR",但没有填写密钥。请先展开"API设置"面板,正确填写 AK 和 SK。

Q3:SUP 字幕加载失败
A:请确认是否已安装 Java。如果未安装,运行"启动程序.bat"按提示下载安装。

Q4:OCR 识别结果出现乱码
A:可能是图片分辨率过低或文字过小,可以尝试换用另一个 OCR 引擎(百度→千问,或反之)对比效果。

Q5:表格列宽不适应,图片显示不全
A:可以直接拖拽列标题边缘调整宽度,程序会自动缩放图片以适应列宽。

Q6:批量OCR中途停止后,想重新开始
A:点击工具栏的"停止"按钮,然后再次点击"开始OCR"即可重新开始。

═══════════════════════════════════════════════


十二、版本历史

版本日期更新内容
v1.1.62026-04-08修复百度云 OCR 换行问题
v1.1.42026-04-08新增音乐符号插入功能。
v1.1.32026-04-081.支持鼠标拖入字幕;2.OCR模型新增Google Gemini 3.修复百度云识别Bug。
v1.1.22026-04-04增加对英文字幕的识别
v1.1.12026-04-03修复Bug
v1.1.02026-04-02修复1.模式二式二字号设置无效;2.编辑状态字号不跟随;3.模式二初始填充字号不对
v1.0.92026-04-02修复模式二序号两列显示问题;修复千问OCR双斜线残留问题;新增编辑状态自定义右键菜单(含插入 // 功能)
v1.0.82026-04-02修复 // // 双斜线清理逻辑;新增查找替换功能;模式一时长列加宽;批量OCR增加休息机制
v1.0.72026-04-02新增千问OCR双斜线清理后处理
v1.0.62026-04-02图片智能裁剪优化;批量OCR多行分组逻辑增强
v1.0.52026-04-02新增右键"插入换行符 //";行高增大
v1.0.32026-04-02模式一切换优化;加载进度条;修复模式二闪退
v1.0.12026-04-02修复 PyQt6 导入问题;清理临时文件夹
v1.0.02026-04-01整合版发布,模式一+模式二双模式



下载链接


https://115cdn.com/s/swf88wi335y#
SubtitleOCR_Portable
游客,如果您要查看本帖隐藏内容请回复



『来自123云盘用户的分享』SubtitleOCR_Portable
链接:https://www.123912.com/s/CJe6jv-tsmhh
游客,如果您要查看本帖隐藏内容请回复



通过网盘分享的文件:SubtitleOCR_Portable
链接: https://pan.baidu.com/s/1449nD1ICet3SaXO2ZMXXkA
游客,如果您要查看本帖隐藏内容请回复

═══════════════════════════════════════════════

技术支持

开发者:慕静安
网站:www.yzyy.org
如有问题请前往网站发帖反馈。

感谢使用 SubtitleOCR 字幕工具,祝使用愉快!






QQ20260408-231857.png
回复

使用道具 举报

  • 打卡等级:即来则安
  • 打卡总天数:25
  • 打卡月天数:0
  • 打卡总奖励:38
  • 最近打卡:2026-04-14 08:34:39

14

主题

5

回帖

745

影币

版主

积分
10

版主

发表于 2026-4-2 22:44:49|来自:台湾台北 | 显示全部楼层
不错不错,支持!!!
回复 支持 反对

使用道具 举报

  • 打卡等级:热心大叔
  • 打卡总天数:134
  • 打卡月天数:2
  • 打卡总奖励:243
  • 最近打卡:2026-06-03 15:21:49

830

主题

119

回帖

5388

影币

YzYY工作组

积分
807

1周年纪念2周年纪念

发表于 2026-4-8 11:14:38|来自:台湾台北 | 显示全部楼层
Google AI Studio API Key(需要登录)
  • 地址:https://aistudio.google.com/apikey
  • 用 Google 账号登录即可免费生成 Key
  • 免费额度很大:gemini-2.0-flash 每分钟 15 次、每天 1500 次,字幕工具完全够用
  • 这就是我们 v1.1.3 已经添加的 Gemini 引擎

回复 支持 反对

使用道具 举报

TOP
  • 打卡等级:无名新人
  • 打卡总天数:2
  • 打卡月天数:0
  • 打卡总奖励:9
  • 最近打卡:2026-04-11 03:40:36

0

主题

3

回帖

9

影币

新手上路

积分
0
发表于 2026-4-11 03:40:36|来自:台湾台北 | 显示全部楼层
感谢分享实用工具
回复 支持 反对

使用道具 举报

  • 打卡等级:初来乍到
  • 打卡总天数:4
  • 打卡月天数:0
  • 打卡总奖励:4
  • 最近打卡:2026-04-14 08:35:28

0

主题

4

回帖

4

影币

新手上路

积分
0
发表于 2026-4-14 08:35:28|来自:台湾台北 | 显示全部楼层
感謝分享
回复

使用道具 举报

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

请文明上网,禁止在本站发表任何辱骂性文字。无论是谁的错,骂人的账号一律永久禁言,永不解禁。
娱乐至上,禁谈政治,违者同上。

精选推荐

关闭

站长推荐上一条 /1 下一条

1