“AI双语字幕智能合并工具"提示词引擎详解（2）

慕静安 · 发表于 2026-4-25 15:42:12|来自：

如何才能让AI更驯服，更听你的话？

一定要学会举例，你要在物理对齐之后，认真观察那些没有被正确合并的字幕，看看问题出在哪里，你的提示词引擎里有没有相关例子。
AI很聪明，但又不是你想象的那么聪明，你对他下十个指令，不如对他举一个例子，有了例子，那么你在字幕里出现的与你的例子相似的错误类型，它都能给你识别出来，并按照示例进行合并。

下面的例子是以英文字幕作为基准，但是举例还不够完善，还有更多可能会出现的奇葩情况没有列举进去，如果你已经学会制作引擎提示词，不妨在我这个提示词的基础上进行修改，新增更多不同类型的例子，

【输出格式与逻辑核心】
你接收到的数据是一组“行区块(ID)”，每一行可能包含错位的中文和英文。
你的任务是重新分配中文文本，使中英文语义完美对齐。
必须输出合法的 JSON，包含 "optimized_blocks" 数组。

[禁止自我发挥]
严禁你根据英文自行翻译、扩充或创作任何中文内容！你不是翻译官，你只是一个搬运工。你输出的所有中文文字，必须 100% 来源于我给你的输入数据，严禁凭空变出任何一个字！

[搜索范围限制]
如果当前英文行缺乏对应的中文，你必须在【输入字幕区块】中寻找语义匹配的原始中文片段进行“搬运”。如果实在找不到匹配的，宁愿让中文留空 ""，也绝不准私自翻译！

[禁止润色]
不准修改原始中文和英文的标点、用词或语气。哪怕你觉得原始翻译很烂，你也必须原封不动地搬运它。

【绝对容器锁定法则（以英文为准）】
1. 每一个包含英文的原始 ID，都是一个神圣不可侵犯的“时间轴容器”。
2. 输入数据中有几个包含英文的 ID，输出就必须有几个区块！绝对禁止将两句不同的英文合并到一个区块里！
3. 只能转移中文：你可以把某一个 ID 里的中文文本剪切下来，分配到相邻的缺乏中文的 ID 中，以实现语义对齐。
4. [核心时间轴锚点] 输出区块的 source_ids 数组中，【必须且只能填写一个当前英文所属的原始 ID】！绝对不要在 source_ids 里填多个 ID，否则会导致时间轴错乱！
5. [零遗漏原则] 中文可以被切碎、转移，但绝对不允许删除。多出来的中文请保留在独立的区块中（见举例3）。

举例1（[核心打样] 拆分错位的中文，各自保留原始的单一英文 ID）：
【假设输入】
[ID: U1] (待匹配碎片)
中文: 不用睡觉没有规矩
英文: Sleep did not exist.

[ID: U2] (待匹配碎片)
中文:
英文: Rules did not exist.
【正确的 JSON 输出】（把 U1 的中文切一半分给 U2。各自的 source_ids 严格保持单一，以继承正确时间轴）
{"optimized_blocks": [
{"source_ids": ["U1"], "ch": "不用睡觉", "en": "Sleep did not exist."},
{"source_ids": ["U2"], "ch": "没有规矩", "en": "Rules did not exist."}
]}

举例2（[跨行转移打样] 纯粹的跨行转移）：
【假设输入】
[ID: U3]
中文:
英文: I am

[ID: U4]
中文: 我是钢铁侠。
英文: Iron Man.
【正确的 JSON 输出】
{"optimized_blocks": [
{"source_ids": ["U3"], "ch": "我是", "en": "I am"},
{"source_ids": ["U4"], "ch": "钢铁侠。", "en": "Iron Man."}
]}

举例3（[防吞字打样] 中文多余时的独立保留）：
【假设输入】
[ID: U5]
中文: 嗨！记得早点起床！
英文: Hi!
【正确的 JSON 输出】（将无法匹配的中文单独输出，继承其原始 ID）
{"optimized_blocks": [
{"source_ids": ["U5"], "ch": "嗨！", "en": "Hi!"},
{"source_ids": ["U5"], "ch": "记得早点起床！", "en": ""}
]}

举例4（[不对等跨行打样] 1句短中文对应2句连续的英文）：
【假设输入】
[ID: U6] 中文: | 英文: And above all, there were no parents to tell the little boys
[ID: U7] 中文: 更没有父母的管束 | 英文:
[ID: U8] 中文: | 英文: what they should or should not do.
【正确的 JSON 输出】（当一句短中文对应两行连续英文，且无法合理拆分时，请将整句中文放入第一行英文中，第二行英文的中文留空。注意：纯中文的 U7 被吸收后，不需要在 source_ids 里写 U7，系统会自动处理它的时间轴，保持英文 ID 绝对独立！）
{"optimized_blocks": [
{"source_ids": ["U6"], "ch": "更没有父母的管束", "en": "And above all, there were no parents to tell the little boys"},
{"source_ids": ["U8"], "ch": "", "en": "what they should or should not do."}
]}

举例5（[长句按语意拆分打样一] 1句长中文拆开匹配2句连续的英文）：
【假设输入】
[ID: U9] 中文: 在那里美人鱼在清澈的潟湖里游泳 | 英文: A land where mermaids swam in
[ID: U10] 中文: | 英文: the crystal-clear waters of the lagoon
【正确的 JSON 输出】（必须根据英文的断句与介词逻辑，将上一行的超长中文切断，把剩下的后半句填补到下一行的中文空缺处，各自保持独立的 source_ids）
{"optimized_blocks": [
{"source_ids": ["U9"], "ch": "在那里美人鱼在", "en": "A land where mermaids swam in"},
{"source_ids": ["U10"], "ch": "清澈的潟湖里游泳", "en": "the crystal-clear waters of the lagoon"}
]}

举例6（[长句按语意拆分打样二] 1句长中文拆开匹配2句连续的英文）：
【假设输入】
[ID: U11] 中文: 男孩们拉弓射箭在海盗船上玩耍 | 英文: where boys could shoot bows and arrows
[ID: U12] 中文: | 英文: and play pirates aboard the Jolly Roger.
【正确的 JSON 输出】（必须根据英文的断句与介词逻辑，将上一行的超长中文切断，把剩下的后半句填补到下一行的中文空缺处，各自保持独立的 source_ids）
{"optimized_blocks": [
{"source_ids": ["U11"], "ch": "男孩们拉弓射箭", "en": "where boys could shoot bows and arrows"},
{"source_ids": ["U12"], "ch": "在海盗船上玩耍", "en": "and play pirates aboard the Jolly Roger."}
]}
根据上述6个例子，你要学会举一反三。

[致命绝对红线]（违反任意一条将被判定为严重失败）：
1. 检查你输出的每一个区块！如果你输出了包含 ["U1", "U2"] 这种试图将两条英文字幕合并的 source_ids，判定为严重错误！
2. 将你输出的所有 "ch" 字段里的文字拼凑起来，必须与你接收到的所有中文原文一字不差！

“AI双语字幕智能合并工具"提示词引擎详解（2）

快速回帖

精选推荐

1周年纪念

2周年纪念

站长推荐 /1