2021-07-28

ffmpeg-join

1. join
2. concat连接媒体文件
	2.1 具有相同编解码器的文件的串联
		2.1.1 Concat demuxer
		2.1.2 Concat protocol
	2.2 连接不同编解码器的文件
		2.2.1 Concat filter
		2.2.2 使用外部脚本
	2.3 自动生成输入文件
		2.3.1 Linux-bash
		2.3.2 Windows
	2.4 concat选项
3. mux 复用
4. AudioChannel-mix
5 both-play
	5.1 overlay 覆盖选项说明
	5.2. Examples 举例

1. join

https://ffmpeg.org/faq.html#toc-How-can-I-join-video-files_003f

3.13 如何 Join 视频文件？

“join”视频文件是很模糊的。下面的列表解释了不同类型的“join”，并指出了这些在 FFmpeg 中是如何解决的。join 视频文件可能意味着:

concat 连接: one after the other 将它们一个接一个地放置：这被称为连接concatenate 它们(简而言之：concat)详见: https://ffmpeg.org/faq.html#How-can-I-concatenate-video-files
mux 复用: together in the same file 将它们放在同一个文件中，让用户在不同版本之间进行选择（例如：不同的音频语言）：这被称为将它们multiplex复用在一起(简称：mux)，并且通过简单地调用 ffmpeg 与几个 -i 选项。
channels 声道 (audio): to put all channels together in a single stream. 将所有通道放在一个流中（例如：两个单声道流到一个立体声流中）：有时会调用它来合并它们，并且可以使用amerge过滤器来完成。
mix 混合 (audio): to play one on top of the other. 一个在另一个之上播放：这被称为mix混合它们，可以通过首先将它们合并成一个流然后使用pan过滤器随意混合通道来完成。
both 同时播放 (video): display both together 将两者一起显示，并排显示或一个显示在另一部分的顶部；它可以使用overlay视频过滤器来完成。

2. concat连接媒体文件

https://trac.ffmpeg.org/wiki/Concatenate

如果您的媒体文件具有完全相同的编解码器和编解码器参数，您可以按照“连接具有相同编解码器的文件”中所述将它们连接起来。

如果您有不同编解码器的媒体，您可以按照下面的“连接不同编解码器的文件”中的说明将它们连接起来。

2.1 具有相同编解码器的文件的串联

2.1.1 Concat demuxer

https://ffmpeg.org/ffmpeg-formats.html#concat

您可以在文档中阅读有关 concat demuxer 的信息。这个解复用器从一个文本文件中读取一系列文件和其他指令，并一个接一个地解复用它们，就好像它们的所有数据包都被混合在一起一样。所有文件必须具有相同的流（相同的编解码器、相同的时基等），但可以包装在不同的容器格式中。

mylist.txt是包含如下内容的文件列表

file '/path/to/file1.wav'

file '/path/to/file2.wav'

ffmpeg -f concat -safe 0 -i mylist.txt -c copy output.wav

-safe 0 如果路径是相对的，则不需要。

$ ffmpeg -f concat -i g1.txt -c copy output.mkv

您还可以循环播放视频。此示例将循环input.mkv10 次：

for i in {1..10}; do printf "file '%s'\n" input.mkv >> mylist.txt; done

ffmpeg -f concat -i mylist.txt -c copy output.mkv

2.1.2 Concat protocol

demuxer在流级别工作，而 concat 协议在文件级别工作。可以连接某些文件（MPEG-2 传输流，可能还有其他文件）。这类似于cat在类 UNIX 系统或Windows 上的copy。

以下命令连接三个 MPEG-2 TS 文件并连接它们而不重新编码：

$ ffmpeg -i "concat:input1.ts|input2.ts|input3.ts" -c copy output.ts

$ ffmpeg -i "concat:g1.mkv|g2.mkv" -c copy output.mkv

注: 看起来不支持mkv, 参照以上写法(原始文件g1.mkv g2.mkv 各10s). 输出总10s, 视频合并为一个流(一个被覆盖所以永远看不到); 音频则合并为一个流(就是同时播放的效果).

使用中间文件

如果您有 MP4 文件，可以通过首先将它们转码为 MPEG-2 传输流来无损地连接这些文件。对于 H.264 视频和 AAC 音频，可以使用以下内容：

ffmpeg -i input1.mp4 -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate1.ts

ffmpeg -i input2.mp4 -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate2.ts

ffmpeg -i "concat:intermediate1.ts|intermediate2.ts" -c copy -bsf:a aac_adtstoasc output.mp4

使用命名管道避免中间文件

如果您使用的系统支持命名管道，则可以使用它们来避免创建中间文件。这会将 stderr（ffmpeg 将所有写入的数据发送到它）发送到/dev/null，以避免使命令行混乱：

mkfifo temp1 temp2

ffmpeg -y -i input1.mp4 -c copy -bsf:v h264_mp4toannexb -f mpegts temp1 2> /dev/null & \

ffmpeg -y -i input2.mp4 -c copy -bsf:v h264_mp4toannexb -f mpegts temp2 2> /dev/null & \

ffmpeg -f mpegts -i "concat:temp1|temp2" -c copy -bsf:a aac_adtstoasc output.mp4

需要 -y 额外的开关来强制 ffmpeg 写入现有文件temp1和temp2，它们是命名管道。如果没有开关，在后台运行的前两个 ffmpeg 程序将不会产生任何输出，因为它们等待交互式是/否回答是否覆盖现有文件的问题。

2.2 连接不同编解码器的文件

在很多情况下，输入文件会有不同的编解码器或不同的编解码器属性，这使得无法使用上述任何一种方法。

2.2.1 Concat filter

https://ffmpeg.org/ffmpeg-filters.html#concat

有关更多信息，请参阅concat 过滤器文档。该过滤器适用于同步视频和音频流的片段。所有段必须具有相同数量的每种类型的流，这也将是输出的流数。

注意：过滤器与流复制不兼容；你不能用-c copy这种方法。由于您必须重新编码视频和音频流，并且重新编码可能会引入压缩伪影，因此请确保添加正确的目标比特率bitrate 或质量quality设置。有关更多信息，请参阅编码指南。

要使 concat 过滤器工作，输入必须具有相同的帧尺寸（例如，1920x1080 像素）并且应该具有相同的帧速率。因此，你可能至少需要添加一个 scale or scale2ref 拼接视频前过滤器。少数其他属性也必须匹配，例如流纵横比stream aspect ratio。有关更多信息，请参阅过滤器的文档。

http://ffmpeg.org/ffmpeg-filters.html#scale-1

http://ffmpeg.org/ffmpeg-filters.html#scale2ref

假设我们有三个要连接的文件——每个文件都有一个视频和音频流。concat 过滤器命令如下所示：

ffmpeg -i input1.mp4 -i input2.webm -i input3.mov \

-filter_complex "[0:v:0][0:a:0][1:v:0][1:a:0][2:v:0][2:a:0]concat=n=3:v=1:a=1[outv][outa]" \

-map "[outv]" -map "[outa]" output.mkv

现在，让我们剖析该命令。我们首先指定所有输入文件，然后实例化一个-filter_complex过滤器图——这是需要的，而不是-filter:v因为它有多个输入和输出。

[0:v:0][0:a:0][1:v:0][1:a:0][2:v:0][2:a:0]

告诉 ffmpeg 从输入文件中获取哪些流并将其作为输入发送到 concat 过滤器。在这种情况下，视频流 0 [0:v:0] 和音频流 0 [0:a:0] 来自输入 0（input1.mp4在本例中），视频流 0 [1:v:0] 和音频流 0 [ 1:v:0] 来自输入 1 ( input2.webm) 等。

concat=n=3:v=1:a=1[outv][outa]'

这是 concat 过滤器本身。n=3告诉过滤器有三个输入段；v=1告诉它每个片段将有一个视频流；a=1告诉它每段将有一个音频流。然后过滤器连接这些段并产生两个输出流。[outv]和[outa]是这些输出流的名称。请注意，过滤器部分周围的引号是必需的。

然后，您可以在其他过滤器中重新使用这些流，或将它们映射到输出文件：

-map "[outv]" -map "[outa]" output.mkv

这告诉 ffmpeg 使用 concat 过滤器的结果，而不是直接来自输入文件的流。

ffmpeg -i g1.mkv -i g2.mkv -filter_complex "[0:v:0][0:a:0][1:v:0][1:a:0]concat=n=2:v=1:a=1[outv][outa]" -map "[outv]" -map "[outa]" output.mkv

2.2.2 使用外部脚本

有一个名为mmcat的 Bash 脚本对于不包含concat过滤器的旧版本 ffmpeg 很有用。

https://trac.ffmpeg.org/wiki/mmcat

2.3 自动生成输入文件

2.3.1 Linux-bash

with a bash for loop

$ for f in *.wav; do echo "file '$f'" >> mylist.txt; done

or with printf

$ printf "file '%s'\n" *.wav > mylist.txt

即时更改播放列表文件

concat demuxer 仅在需要时打开引用的文件。这使我们能够在 demuxer 后面原子地交换引用的文件，以便能够将 concat demuxer 用作可更改的实时源。查看以下示例文件 list.txt：

ffconcat version 1.0

file dummy.mxf

dummy.mxf 被引用两次，以确保 concat demuxer 在它到达时重新打开文件。将此与无限循环结合起来，您就完成了：

$ ffmpeg -re -stream_loop -1 -i list.txt -flush_packets 0 -f mpegts udp://127.0.0.1:5000?pkt_size=1316

现在您可以通过简单的移动命令更改循环剪辑：

$ mv next_clip.mxf dummy.mxf

自动附加到列表文件

如果当前不存在下一个剪辑，则连接不起作用，因为在读取整个列表之前不会开始解码。但是，可以引用当前列表末尾的另一个列表。以下脚本为此机制提供了一个示例：

https://trac.ffmpeg.org/wiki/Concatenate#demuxer

请注意，递归引用播放列表文件将导致 ffmpeg 最终耗尽文件描述符（或其他资源），因为 ffmpeg 仅在播放列表完成时关闭播放列表文件，但在上面的示例中，由于递归链接实际上没有播放列表文件结尾。

2.3.2 Windows

Command-line:

(for %i in (*.wav) do @echo file '%i') > mylist.txt

Powershell:

foreach ($i in Get-ChildItem .\*.wav) {echo "file '$i'" >> mylist.txt}

bat-file:

(for %%i in (*.wav) do @echo file '%%i') > mylist.txt

2.4 concat选项

https://ffmpeg.org/ffmpeg-formats.html#Options

3.4.2 Options

https://ffmpeg.org/ffmpeg-all.html#Options-40

20.4.2 Options

此多路分配器接受以下选项：

-safe

如果设置为 1，则拒绝不安全的文件路径。如果文件路径不包含协议规范并且是相对的，并且所有组件仅包含可移植字符集中的字符（字母、数字、句点、下划线和连字符）并且组件开头没有句点，则该文件路径被认为是安全的。

如果设置为 0，则接受任何文件名。

默认值为 1。

-1 等价于 1 如果格式被自动探测，否则为 0。

-auto_convert

如果设置为 1，则尝试对数据包数据执行自动转换以使流可连接。默认值为 1。

目前，唯一的转换是将 h264_mp4toannexb 比特流过滤器添加到 MP4 格式的 H.264 流中。如果分辨率发生变化，这尤其必要。

-segment_time_metadata

如果设置为 1，每个数据包将包含 lavf.concat.start_time 和 lavf.concat.duration 数据包元数据值，它们是连接输出中各个文件段的 start_time 和持续时间，以微秒表示。仅当基于 concat 文件已知时才设置持续时间元数据。默认值为 0。

3. mux 复用

2个视频流, 选择播放, 并不首位相接. 音频只保留了1个.

$ ffmpeg -i g0.mkv -i h0.mkv -map 0:0 -map 1:0 -map 0:1 -c copy ot2.mkv

2个视频流, 2个音频流, 选择播放.

$ ffmpeg -i g0.mkv -i h0.mkv -map 0:0 -map 1:0 -map 0:1 -map 1:1 -c copy ot2.mkv

$ ffmpeg -i g0.mkv -i h0.mkv -i a1.flv -map 0:0 -map 1:0 -map 2:0 -map 0:1 -c copy ot2.mkv

$ ffmpeg -i g0.mkv -i h0.mkv -i a1.flv -i a2.mp4 -i c0.mkv -map 0:0 -map 1:0 -map 2:0 -map 3:0 -map 4:0 -map 0:1 -map 4:1 -c copy ot2.mkv

更多视频融合为流, 不编译, 速度也能快. 分辨率不同, 也都会保留各自的分辨率.

4. AudioChannel-mix

2.8 Channel Layout 通道布局

https://szosoft.blogspot.com/2021/06/ffmpeg-utils.html#2.8

https://www.cnblogs.com/sztom/p/14918694.html#2.8

下表摘录自如下页面:

https://trac.ffmpeg.org/wiki/AudioChannelManipulation

Picture	https://trac.ffmpeg.org/wiki/AudioChannelManipulation
	[1.1-4] stereo → mono stream Downmix both channels 下缩两个通道 Use -ac 将单个立体声流混合成单声道流。立体声流的两个通道都将被缩混到流中： $ ffmpeg -i stereo.flac -ac 1 mono.flac 警告：任何异相立体声都会抵消。以下滤波器图可用于在缩混之前使立体声同相异相: -af "asplit[a],aphasemeter=video=0,ametadata=select:key=lavfi.aphasemeter.phase:value=-0.005:function=less,pan=1c\|c0=c0,aresample=async=1:first_pts=0,[a]amix"
	[1.2] 立体声 → 单声道 Choose a specific channel 选择特定频道 Use channelsplit or pan 此示例使用 channelsplit 音频过滤器仅包含正确的通道： $ ffmpeg -i stereo.wav -filter_complex "[0:a]channelsplit=channel_layout=stereo:channels=FR[right]" -map "[right]" front_right.wav $ ffmpeg -i stereo.wav -af "pan=mono\|c0=c1" mono.m4a 或者，您可以c0=FR改用。如果想要左声道，请使用c0=c0或c0=FL。
	[2-5] stereo → 2 × mono files Use channelsplit or -map_channel or pan 使用 channelsplit 音频过滤器将立体声输入中的每个通道输出到单独的单声道文件： $ ffmpeg -i stereo.wav -filter_complex "[0:a]channelsplit=channel_layout=stereo[left][right]" -map "[left]" left.wav -map "[right]" right.wav $ ffmpeg -i stereo.wav -map_channel 0.0.0 left.wav -map_channel 0.0.1 right.wav $ ffmpeg -i stereo.wav -filter_complex "[0:a]pan=1c\|c0=c0[left];[0:a]pan=1c\|c0=c1[right]" -map "[left]" left.wav -map "[right]" right.wav
	[3] stereo → 2 × mono streams Use channelsplit 使用 channelsplit 音频过滤器将立体声输入中的每个通道输出到一个输出文件中的单个单声道流： $ ffmpeg -i in.mp3 -filter_complex "[0:a]channelsplit=channel_layout=stereo" output.mka
	[4-1.1] mono → stereo Use -ac or amerge 从一个单声道输入创建立体声输出： $ ffmpeg -i input.mp3 -ac 2 output.m4a $ ffmpeg -i input.mp3 -filter_complex "[0:a][0:a]amerge=inputs=2[a]" -map "[a]" output.m4a 注意：这些示例不会从单声道输入神奇地创建“真正的”立体声输出，而只是将相同的音频放入输出的左右声道（两个声道将相同）。
	[5-2] 2 × mono → stereo Use join or amerge 使用 join 音频过滤器从两个单声道输入创建立体声输出： $ ffmpeg -i left.mp3 -i right.mp3 -filter_complex "[0:a][1:a]join=inputs=2:channel_layout=stereo[a]" -map "[a]" output.mp3 $ ffmpeg -i left.mp3 -i right.mp3 -filter_complex "[0:a][1:a]amerge=inputs=2[a]" -map "[a]" output.mka
	[10] stereo → stereo Mix both stereo channels to stereo 两个立体声通道混合为立体声 pan 输出的左右声道将分别包含输入的左右声道： $ ffmpeg -i input.mp3 -af "pan=stereo\|c0<c0+c1\|c1<c0+c1" output.ogg
	[11] Switch stereo channels 切换立体声通道 Use channelmap or pan or -map_channel 使用 channelmap 音频过滤器将左声道切换到右声道和右声道切换到左声道： $ ffmpeg -i stereo.mp3 -filter_complex "channelmap=map=FL-FR\|FR-FL:channel_layout=stereo" output.mp3 $ ffmpeg -i stereo.ogg -af pan=stereo\|c0=c1\|c1=c0 output.wav $ ffmpeg -i stereo.ogg -map_channel 0.0.1 -map_channel 0.0.0 output.wav
	[12] Mute a channel 静音 Use pan or -map_channel 此示例使用 pan 音频过滤器将第一个通道（左前）静音，但保持第二个通道（右前）不变： $ ffmpeg -i stereo.wav -af "pan=stereo\|c1=c1" output.wav $ ffmpeg -i stereo.wav -map_channel -1 -map_channel 0.0.1 output.wav

Picture	https://trac.ffmpeg.org/wiki/AudioChannelManipulation
	[8] 5.1 → stereo Use -ac or pan 要缩混，您可以简单地使用-ac 2： $ ffmpeg -i 6channels.wav -ac 2 stereo.wav 注意: 默认情况下，使用-ac 2LFE 通道时省略。请参见“数字音频压缩标准（文件A / 52：2012） ”，部分6.1.12和7.8的更多信息缩混。 http://atsc.org/wp-content/uploads/2015/03/A52-201212-17.pdf ffmpeg集成了一个默认的向下混音（和向上混音）系统，-ac除非您有非常特殊的需求，否则该系统应该优先于（选项）而不是 pan 过滤器。如果您想映射特定频道并删除其余频道，您可以使用 pan 音频过滤器。这会将FL输入的（左前）映射到 FL输出的，并将输入的FR（右前）映射到FR输出的： $ ffmpeg -i 6channels.wav -af "pan=stereo\|c0=FL\|c1=FR" stereo.wav 您还可以按编号映射特定频道。此示例将输入的第一个和第三个通道映射到输出的第一个和第二个通道。 $ ffmpeg -i 6channels.wav -af "pan=stereo\|c0=c0\|c1=c2" output.wav 如果将=通道规范中的替换为<，则该规范的增益将被重新归一化，使总数为 1，从而避免削波噪声。有关其他信息和示例，请参阅声像音频过滤器文档。 https://ffmpeg.org/ffmpeg-filters.html#pan
	[9.1] 2 × stereo → stereo (a.fl + b.fl → c.FL; a.fr + b.fr → c.FR) Use amerge和pan or -ac 使用amerge和pan音频过滤器将两个立体声输入合并为一个立体声输出： $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2,pan=stereo\|c0<c0+c2\|c1<c1+c3[a]" -map "[a]" output.mp3 $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2[a]" -map "[a]" -ac 2 output.mp3 注意：使用 pan 音频过滤器产生的输出可能与使用产生的输出不同-ac 2，因此您必须聆听输出或查看音频统计信息，以确定哪种输出适合您. https://trac.ffmpeg.org/wiki/AudioChannelManipulation#Statistics
	[9.2] (a.fl + fr → c.FL; b.fl + fr → c.FR) Use amerge和pan 与上面类似的情况，而是使用第一个输入的左右声道使左声道输出，并使用第二个输入的左右声道使输出的右声道。只需更改平移过滤器中的通道规格： $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2,pan=stereo\|c0<c0+c1\|c1<c2+c3[a]" -map "[a]" output.mp3 在这种情况下必须使用声像音频过滤器，而不是-ac 2与前面的示例不同。

https://trac.ffmpeg.org/wiki/AudioChannelManipulation

[6-7] 6 × mono → 5.1 Use join or amerge
使用 join 音频过滤器将 6 个单声道输入合并为一个 5.1（6 声道）输出：
$ ffmpeg -i front_left.wav -i front_right.wav -i front_center.wav -i lfe.wav -i back_left.wav -i back_right.wav \
-filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a]join=inputs=6:channel_layout=5.1[a]" -map "[a]" output.wav
加入音频过滤器还允许您手动选择布局：
$ ffmpeg -i front_left.wav -i front_right.wav -i front_center.wav -i lfe.wav -i back_left.wav -i back_right.wav \
-filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a]join=inputs=6:channel_layout=5.1:map=0.0-FL|1.0-FR|2.0-FC|3.0-LFE|4.0-BL|5.0-BR[a]" -map "[a]" output.wav
另一种使用amerge音频过滤器的方法比上面显示的连接过滤器灵活一些：
$ ffmpeg -i front_left.wav -i front_right.wav -i front_center.wav -i lfe.wav -i back_left.wav -i back_right.wav \
-filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a]amerge=inputs=6[a]" -map "[a]" output.wav
使用 amerge，所有输入必须具有相同的采样率和格式。如果输入的持续时间不同，则输出将以最短的时间停止。

[7-6] 5.1 → 6 × mono Use channelsplit
使用 channelsplit 音频过滤器将 5.1 声道输入拆分为单独的每声道文件：
$ ffmpeg -i in.wav \
-filter_complex "channelsplit=channel_layout=5.1[FL][FR][FC][LFE][BL][BR]" \
-map "[FL]" front_left.wav \
-map "[FR]" front_right.wav \
-map "[FC]" front_center.wav \
-map "[LFE]" lfe.wav \
-map "[BL]" back_left.wav \
-map "[BR]" back_right.wav

[13] Remap channels 重新映射 Use channelmap

channelmap 音频滤波器可以重新安排信道的布局。例如，要在 5.1 输入中切换 FL 和 FR 通道：

[14] Virtual Binaural Acoustics 虚拟双耳声学 sofalizer

FFmpeg 可以使用 sofalizer 音频过滤器生成虚拟双耳声学文件。输入支持大多数已知的通道布局，并且输出始终是立体声。

$ ffmpeg -i input.wav -af sofalizer=/path/to/sofa/file output.flac

https://sofacoustics.org/data/database/ari/

[15] Multiple channel layouts 多通道布局 pan

此示例使用 pan 音频过滤器将两个布局 (5.1+2.0) 组合成一个任意布局：

$ ffmpeg -i input -filter_complex "pan=5.1+downmix|FL=c0|FR=c1|FC=c2|LFE=c3|BL=c4|BR=c5|DL=c6|DR=c7[a]" -map "[a]" out.wav

示例中的输出产生了一个具有 8 个通道的音频流。

本节用到的主要选项及过滤器:

分/合 -ac
分/合 -map_channel
分/合 channelmap
分/合 pan
分 channelsplit
合 join
合 amerge

5. both-play

both 同时播放 (video): display both together 将两者一起显示，并排显示或一个显示在另一部分的顶部；它可以使用overlay视频过滤器来完成。

https://ffmpeg.org/ffmpeg-filters.html#overlay-1

5.1 overlay 覆盖选项说明

将一个视频叠加在另一个视频上。

它需要两个输入，一个输出。第一个输入是覆盖第二个输入的“主”视频。

它接受以下参数：

x, y 设置主视频上叠加视频的 x 和 y 坐标表达式。两个表达式的默认值都是“0”。如果表达式无效，则将其设置为一个巨大的值（意味着不会在输出可见区域内显示叠加层）。

eval 在计算 x 和 y 的表达式时设置。它接受以下值：

‘init’ 仅在过滤器初始化期间或处理命令时对表达式求值一次

‘frame’ 评估每个传入帧的表达式. Default value is ‘frame’.

format 设置输出视频的格式。它接受以下值：

‘yuv420’ force YUV420 output

‘yuv420p10’ force YUV420p10 output

‘yuv422’ force YUV422 output

‘yuv422p10’ force YUV422p10 output

‘yuv444’ force YUV444 output

‘rgb’ force packed RGB output

‘gbrp’ force planar RGB output

‘auto’ automatically pick format

Default value is ‘yuv420’.

eof_action See framesync.

shortest See framesync. 请参阅帧同步。

repeatlast See framesync. https://ffmpeg.org/ffmpeg-filters.html#framesync

alpha 设置叠加视频的 alpha 格式，可以是直接或预乘。默认是 straight。

x 和 y 表达式可以包含以下参数。

main_w, W

main_h, H

The main input width and height. 主要输入宽度和高度。

overlay_w, w

overlay_h, h

The overlay input width and height. 叠加输入宽度和高度。

x, y x 和 y 的计算值。它们针对每个新帧进行评估。

hsub

vsub

输出格式的水平和垂直色度子样本值。例如，对于像素格式“yuv422p”，hsub 为 2，vsub 为 1。

n 输入帧数，从0开始

pos 输入帧在文件中的位置，如果未知，则为 NAN

t 时间戳，以秒表示。如果输入时间戳未知，则为 NAN。

此过滤器还支持帧同步选项。

请注意，n、pos、t 变量仅在每帧完成评估时可用，并且当 eval 设置为“init”时将评估为 NAN。

请注意，帧是按时间戳顺序从每个输入视频中获取的，因此，如果它们的初始时间戳不同，最好通过 setpts=PTS-STARTPTS 过滤器传递两个输入，让它们以相同的零时间戳开始，就像电影过滤器的例子一样。

您可以将更多的叠加层链接在一起，但您应该测试这种方法的效率。

11.161.1 Commands

此过滤器支持以下命令：

修改覆盖输入的 x 和 y。该命令接受相应选项的相同语法。

如果指定的表达式无效，则保持其当前值。

5.2 Examples 举例

在距主视频右下角 10 像素处绘制叠加层：

overlay=main_w-overlay_w-10:main_h-overlay_h-10

使用命名选项，上面的例子变成：

overlay=x=main_w-overlay_w-10:y=main_h-overlay_h-10

使用带有 -filter_complex 选项的 ffmpeg 工具在输入的左下角插入一个透明的 PNG 徽标：

$ ffmpeg -i input -i logo -filter_complex 'overlay=10:main_h-overlay_h-10' output

使用 ffmpeg 工具插入 2 个不同的透明 PNG 标志（右下角的第二个标志）：

$ ffmpeg -i input -i logo1 -i logo2 -filter_complex 'overlay=x=10:y=H-h-10,overlay=x=W-w-10:y=H-h-10' output

在主视频的顶部添加一个透明的颜色层； WxH 必须指定覆盖过滤器的主要输入的大小：

color=color=red@.3:size=WxH [over]; [in][over] overlay [out]

使用 ffplay 工具并排播放原始视频和过滤版本（此处使用 deshake 过滤器）：

$ ffplay input.avi -vf 'split[a][b]; [a]pad=iw*2:ih[src]; [b]deshake[filt]; [src][filt]overlay=w'

上面的命令等同于：

$ ffplay input.avi -vf 'split[b], pad=iw*2[src], [b]deshake, [src]overlay=w'

从时间 2 开始，从屏幕的左上方到右上方出现一个滑动覆盖：

overlay=x='if(gte(t,2), -w+(t-2)*20, NAN)':y=0

通过将两个输入视频并排放置来组合输出：

$ ffmpeg -i left.avi -i right.avi -filter_complex "

nullsrc=size=200x100 [background];

[0:v] setpts=PTS-STARTPTS, scale=100x100 [left];

[1:v] setpts=PTS-STARTPTS, scale=100x100 [right];

[background][left] overlay=shortest=1 [background+left];

[background+left][right] overlay=shortest=1:x=100 [left+right]

通过将 delogo 过滤器应用于某个部分来屏蔽视频的 10-20 秒

$ ffmpeg -i test.avi -codec:v:0 wmv2 -ar 11025 -b:v 9000k

-vf '[in]split[split_main][split_delogo];[split_delogo]trim=start=360:end=371,delogo=0:0:640:480[delogoed];[split_main][delogoed]overlay=eof_action=pass[out]'

masked.avi

级联多个叠加层：

nullsrc=s=200x200 [bg];

testsrc=s=100x100, split=4 [in0][in1][in2][in3];

[in0] lutrgb=r=0, [bg] overlay=0:0 [mid0];

[in1] lutrgb=g=0, [mid0] overlay=100:0 [mid1];

[in2] lutrgb=b=0, [mid1] overlay=0:100 [mid2];

[in3] null, [mid2] overlay=100:100 [out0]

2021-07-11

Subtitle-ass-srt

1. ass
	1.1 ssa-ass
	1.2 脚本说明
		1.2.1 头部
		1.2.2 样式定义
		1.2.3 主体
		1.2.4 注意事项
	1.3 双语字幕
2. srt
	2.1 文件格式
	2.2 样式
	2.3 位置
3. 小结
	3.1 列出支持的格式
	3.2 srt-ass
	3.3. sbv-srt
4 字幕操作
	4.1 软字幕(推荐)
		4.1.1 提取字幕流
		4.1.2 添加字幕流
		4.1.3 注意
	4.2. 硬字幕(不推荐)
5. 相关链接

1. ass

1.1 ssa-ass

https://en.wikipedia.org/wiki/SubStation_Alpha

https://zh.wikipedia.org/wiki/SubStation_Alpha

SubStation Alpha（或 Sub Station Alpha），简称SSA，是由 CS Low（亦作 Kotus）创建、比传统字幕（如SRT）更加强大先进的字幕文件格式。该格式在Windows平台上可以经播放器由VSFilter渲染进行播放。这是一款广受欢迎且已停止开发的字幕编辑制作工具。
而Advanced SubStation Alpha（ASS）是一种比SSA更先进的字幕脚本格式。基于SSA 4.00+编码构建。ASS的主要变化就是在SSA编写风格的基础上增添更多的效果和指令。SSA当前版本为V4.00。ASS则使用更高级的V4.00+编码。

1.2 脚本说明

1.2.1 头部

Script Info: 脚本的一般全局信息:

Title：标题

Original Script：作者

Script Updated By：更新时间

Script Type：类型（用于兼容性设置，SSA为4.00，ASS为4.00+）

PlayResX & PlayResY：屏幕宽高

PlayDepth（决定颜色数量）

Timer：定时器

1.2.2 样式定义

V4 Styles: 定义文字样式，在events部分可以直接调用这些样式。

[V4+ Styles]

Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding

[V4+ 样式]

格式：名称、字体名称、字体大小、原色、副色、轮廓色、底色、粗体、斜体、下划线、删除线、

缩放X、缩放Y、间距、角度、边框样式、外线、阴影、对齐、边距L、边距R、边距V、编码

PrimaryColour. 第一颜色，即文字本身的颜色

SecondaryColour. 第二颜色。在卡拉OK时使用，卡拉OK指令会用第一颜色填充第二颜色。

TertiaryColour（ASS中称为OutlineColour）边框色，文字边框的颜色。

BackColour. 阴影颜色，文字阴影的颜色。

MarginL, MarginR. 左右缩进。文字距离视频最左最右的最小距离。

MarginV. 上下缩进。文字热点（对齐点）距离视频上下的最小间距离。这取决于文字对齐方式，如果该文字使用中对齐，则上下缩进值无效。需要时文字可用\n或\N命令换行。ASS文件中，Script Info部分的一个参数“WrapStyle”也可以改变此值。

Outline. 边框样式，文字可以设定为有边框，无边框，或拥有不透明边框（矩形背景）。

Shadow. 阴影距离。文字的阴影到文字的距离大小。

AlphaLevel. 透明度（0至255有效）

Encoding. ASCII码中的文字编码方式。

1.2.3 主体

Events: 字幕的主体部分。

字幕的出现时间和样式、对样式的修改和特效均在这里编写。其一般语法格式为：{\命令(参数，多个参数用逗号隔开)}, 例如 {\move(80,80,200,200,150,300)}.只有一个参数的命令不需要括号 (如. {\kf89}).

1.2.4 注意事项

一对大括号内可以放置多个语句。如. {\bord8\be1}

换行的 \N 和 \n 命令不需要在两边加大括号就可使用。

1.3 双语字幕

[V4+ Styles]

Style: Default,Arial,16,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,0

Style: Chs,Arial,12,&Hcccccc,&Hcccccc,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,0

Style: Eng,Arial,20,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,0

[Events]

Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text

Dialogue: 0,0:01:06.63,0:01:07.63,Default,,0,0,0,,GIRL: Hey, Nat!\N{\rChs}女孩：嘿，纳特！

Dialogue: 0,0:01:37.08,0:01:38.71,Default,,0,0,0,,We're both upside down.\N{\rChs}我们两个都颠倒了。

Dialogue: 0,0:01:38.87,0:01:40.96,Default,,0,0,0,,And I bet you're gonna fall down first.\N{\rChs}我打赌你会先倒下。

Dialogue: 0,0:01:41.12,0:01:42.66,Default,,0,0,0,,No, you will.\N{\rChs}不，你会的。

2. srt

https://zh.wikipedia.org/wiki/SubRip

https://en.wikipedia.org/wiki/SubRip

SubRip是一款适用于Microsoft Windows的免费软件程序，可将字幕及其时间从各种视频格式提取到文本文件中。它是在GNU GPL下发布的。其字幕格式的文件扩展名得到广泛支持。每个文件都是人类可读的文件格式，其中字幕与时序信息一起顺序存储。互联网上分发的大多数字幕都是这种格式。.srt

2.1 文件格式

序号开始: 标识顺序的数字计数器

时间起始: 字幕应该出现在屏幕上的时间 --> 它应该消失的时间

字幕内容: 一行或多行的字幕文本本身

空行结束: 一个不包含文本的空行，表示该标题的结束

2.2 样式

非正式地，该格式具有非常基本的文本格式，可以根据处理应用程序进行解释或传递以进行渲染。格式源自 HTML 标记的粗体、斜体、下划线和颜色:

粗体——<bold>…</bold>或{bold}…{/bold}

斜体 -<italic>…</italic>或{italic}…{/italic}

下划线 –<underline>…</underline>或{underline}…{/underline}

color 字体颜色 - <font color="color name or #code">…</font>（如在HTML 中）

position 行位置 -X1:… X2:… Y1:… Y2:…在时间戳之后表示文本坐标

2.3 位置

字幕摆放, 若不明示, 则处在底部居中位置, 即默认{\an2}. 可使用如下标识控制字幕出现的位置.

|\– 字幕靠左字幕居中字幕靠右

顶部 {\an7} {\an8} {\an9}

中间 {\an4} {\an5} {\an6}

底部 {\an1} {\an2} {\an3}

3. 小结

ass 相当于 srt + 简单样式表

只需要单纯文本字幕时使用 srt
需要样式文本字幕时使用 ass

常见的应用是中英双语字幕时, 使用ass可以很方便的分别控制2种语言的颜色, 字体大小.

3.1 列出支持的格式

$ ffmpeg -hide_banner -codecs | grep "^...S"

..S... = Subtitle codec

DES... ass ASS (Advanced SSA) subtitle (decoders: ssa ass ) (encoders: ssa ass )

..S... srt SubRip subtitle with embedded timing

..S... ssa SSA (SubStation Alpha) subtitle

DES... subrip SubRip subtitle (decoders: srt subrip ) (encoders: srt subrip )

DES... mov_text MOV text

...

3.2 srt-ass

https://trac.ffmpeg.org/wiki/HowToConvertSubtitleToASS

$ ffmpeg -i input.srt output.ass

$ ffmpeg -i out.ass out.srt

3.3 sbv-srt

https://trac.ffmpeg.org/wiki/HowToConvertYouTubeSBVtoSRT

ffmpeg -i captions.sbv captions.srt

ffmpeg -fix_sub_duration -i captions.sbv captions.srt

4. 字幕操作

4.1 软字幕(推荐)

软字幕是独立于视频流的字幕流信息, 可以加入多个, 删除也很方便, 视频不需要重新编码, 速度相当于复制文件.

4.1.1 提取字幕流

查看视频文件信息, 找到需要的字幕流

$ ffmpeg -i input.mkv

不指定map, 默认提取第一个字幕

$ ffmpeg -i input.mkv sub.srt

绝对map, 提取第6个流信息

$ ffmpeg -i input.mkv -map 0:5 sub.srt

相对map, 提取第4个字幕流信息

$ ffmpeg -i input.mkv -map 0:s:3 sub.srt

4.1.2 添加字幕流

添加1个字幕流

$ ffmpeg -i IceAge3.mp4 -i sub.english.srt -map 0 -map 1 -c copy -c:s mov_text -metadata:s:s:0 language=en IceAge3.en.mp4

$ ffmpeg -i IceAge3.mp4 -i sub.english.srt -map 0 -map 1 -c copy -c:s mov_text IceAge3.en1.mp4

在已有字幕的基础上添加新字幕

ffmpeg -i IceAge3.en.mp4 -i sub.chinese.srt -map 0 -map 1 -c copy -c:s mov_text IceAge3.encn.mp4

添加多个字幕流

$ ffmpeg -i IceAge3.mp4 -i sub.english.srt -i sub.chinese.srt -i sub.ass.en.ass -map 0 -map 1 -map 2 -map 3 -c copy -c:s mov_text -metadata:s:s:0 language=en -metadata:s:s:1 language=cn -metadata:s:s:2 language=en.ass IceAge3sub.mp4

$ ffmpeg -i IceAge3.mp4 -i sub.english.srt -i sub.chinese.srt -i sub.ass.en.ass -map 0 -map 1 -map 2 -map 3 -c copy -c:s mov_text IceAge3sub.mp4

$ ffmpeg -i Trese.avi -i en.srt -i CN.srt -map 0:v -map 0:a -map 1 -map 2 -c:v copy -c:a copy -c:s mov_text -metadata:s:s:0 language=en -metadata:s:s:1 language=cn out2.mp4

$ ffmpeg -i Trese.avi -i en.srt -i CN.srt -map 0 -map 0:s:0 -map 0:s:1 -map 0:s:2 -c copy -c:s mov_text -metadata:s:s:0 language=en -metadata:s:s:1 language=cn out2.mp4

4.1.3 注意

不指定map则无效

ffmpeg -i input.mp4 -i sub.srt -c copy out.mp4

ffmpeg -i input.mp4 -i sub.srt -map 0 -c copy out.mp4

如下语法, 对于mp4无效, 对于mkv,则会增加字幕.

ffmpeg -i input.mp4 -i sub.srt -map 0 -map 1 -c copy out.mp4

$ ffmpeg -i input.mkv -i sub.srt -map 0 -map 1 -c copy out.mkv

完整语法:

$ ffmpeg -i input.mp4 -i sub.srt -map 0 -map 1 -c copy -c:s mov_text out.mp4

$ ffmpeg -i input.mp4 -i sub.srt -map 0 -map 1 -c copy -c:s mov_text -metadata:s:s:0 title=en out.mp4

$ ffmpeg -i input.mp4 -i sub.srt -map 0 -map 1 -c copy -c:s mov_text -metadata:s:s:0 language=en out.mp4

4.2 硬字幕(不推荐)

将字幕嵌入到视频帧中，这个过程需要重新编解码，所以速度比较慢。而且不可逆.

https://trac.ffmpeg.org/wiki/HowToBurnSubtitlesIntoVideo

您可以使用以下两种过滤器之一来刻录文本字幕（硬字幕）：subtitles或ass.

subtitles 滤镜

http://ffmpeg.org/ffmpeg-filters.html#subtitles-1

ffmpeg -i video.avi -vf subtitles=subtitle.srt out.avi

ffmpeg -i video.mkv -vf subtitles=video.mkv out.avi

ass 滤镜

http://ffmpeg.org/ffmpeg-filters.html#ass

ffmpeg -i video.avi -vf "ass=subtitle.ass" out.avi

它仅限于ASS（高级变电站阿尔法）字幕文件, 所以若是SubRip，MicroDVD或任何其他支持的文本字幕，您必须在使用此过滤器之前将其转换为 ASS：

https://trac.ffmpeg.org/wiki/HowToConvertSubtitleToASS

ffmpeg -i subtitle.srt subtitle.ass

基于图片的字幕

你可以燃烧“基于图像的”字幕到一部电影中，通过使用叠加视频滤波器以覆盖图像。例如，dvdsub 是一种基于图片的叠加字幕。在单独的流中带有 dvdsub 字幕的 MKV 示例：

ffmpeg -i input.mkv -filter_complex "[0:v][0:s]overlay[v]" -map "[v]" -map 0:a <output options> output.mkv

https://www.cnblogs.com/sztom/p/11909360.html

https://szosoft.blogspot.com/2019/11/ffmpeg-01-subtitle.html

https://en.wikipedia.org/wiki/Subtitles

https://zh.wikipedia.org/wiki/字幕

https://en.wikipedia.org/wiki/Comparison_of_subtitle_editors

https://en.wikipedia.org/wiki/Comparison_of_video_player_software#Subtitle_ability

https://en.wikipedia.org/wiki/Speech_recognition

https://zh.wikipedia.org/wiki/语音识别

https://translations.ted.com/How_to_Compress_Subtitles

2021-07-09

Windows-RW-LinuxFS

1. wsl2
	1.1 先决条件
	1.2 挂载未分区的磁盘
		1.2.1 识别磁盘
		1.2.2 挂载磁盘
	1.3 挂载分区磁盘
		1.3.1 识别磁盘
		1.3.2 列出并选择要在 WSL 2 中挂载的分区
		1.3.3 识别文件系统类型
		1.3.4 挂载选定的分区
	1.4 访问磁盘内容
	1.5 卸载磁盘
	1.6 在 WSL 中挂载 VHD
	1.7 命令行参考
	1.8 挂载特定分区
	1.9 指定挂载选项
	1.a 连接磁盘而不安装它
	1.b 分离磁盘
	1.c. 限制
2. linux-reader(只读)
3 商业软件
	3.1 paragon
	3.2. UFS Explorer
4. ext2read
5. Ext2Fsd
6. 文件系统对比

1. wsl2

在 WSL2 中挂载 Linux 磁盘（预览版） 04/08/2021

https://docs.microsoft.com/en-us/windows/wsl/wsl2-mount-disk

如果要访问 Windows 不支持的 Linux 磁盘格式，可以使用 WSL2 挂载磁盘并访问其内容。

注意: 将磁盘附加到 WSL2 需要管理员访问权限。 WSL2 mount命令不支持挂载当前正在使用的磁盘（或属于该磁盘的分区）。wsl --mount即使只请求一个分区，也总是附加整个磁盘。无法挂载 Windows 安装盘。

注! 下文命令行开头标识有如下2种:

> (大于号)开头的命令表示在Windows的PowerShell中.
$ (美元符号)开头的命令表示Linux的Bash环境.

1.1 先决条件

您需要使用 Windows 10 Build 20211 或更高版本才能访问此功能。您可以加入Windows预览体验计划以获取最新的预览版本。

https://insider.windows.com/en-us/

1.2 挂载未分区的磁盘

在这种最简单的情况下，如果您的磁盘没有任何分区，则可以直接使用该wsl --mount命令挂载它。首先，您需要识别磁盘。

1.2.1 识别磁盘

要列出 Windows 中的可用磁盘，请在PowerShell中运行：

> wmic diskdrive list brief

磁盘路径在“DeviceID”列下可用。通常根据\\.\PHYSICALDRIVE*格式。

1.2.2 挂载磁盘

然后在 Powershell 中，您可以使用上面发现的磁盘路径挂载磁盘。

> wsl --mount <DiskPath>

1.3 挂载分区磁盘

1.3.1 识别磁盘

要列出 Windows 中的可用磁盘，请在PowerShell中运行：

> wmic diskdrive list brief

磁盘路径在“DeviceID”列下可用。通常根据\\.\PHYSICALDRIVE*格式。

1.3.2 列出并选择要在 WSL 2 中挂载的分区

> wsl --mount <DiskPath> --bare

这将使磁盘在 WSL 2 中可用。

连接后，可以通过在 WSL 2 中运行以下命令来列出分区(已经入Bash环境)：

$ lsblk

这将显示可用的块设备及其分区。

在 Linux 中，块设备被标识为 /dev/<Device><Partition>. 例如，/dev/sdb3 是磁盘的分区号 3 sdb。

1.3.3 识别文件系统类型

如果您不知道磁盘或分区的文件系统类型，可以在PowerShell使用以下命令：

> blkid <BlockDevice>

这将输出检测到的文件系统类型（在TYPE="<Filesystem>"格式下）。

1.3.4 挂载选定的分区

确定要挂载的分区后，在每个分区上运行以下命令：

> wsl --mount <DiskPath> --partition <PartitionNumber> --type <Filesystem>

注意: 如果您希望将整个磁盘安装为单个卷（即如果磁盘未分区），--partition则可以省略。如果省略，则默认文件系统类型为“ext4”。

1.4 访问磁盘内容

安装后，可以在配置值指向的路径下访问磁盘：automount.root. 默认值为/mnt/wsl。

在 Windows 中，可以通过导航到以下位置从文件资源管理器访问磁盘：（\\wsl$\\<Distro>\\<Mountpoint>选择任何 Linux 发行版）。

1.5 卸载磁盘

如果要从 WSL 2 卸载和分离磁盘，请运行：

> wsl --unmount <DiskPath>

1.6 在 WSL 中挂载 VHD

您还可以使用wsl --mount. 为此，您首先需要使用 Windows 中的Mount-VHD命令将 VHD 挂载到 Windows中。请务必以管理员权限运行此命令。下面是我们使用此命令的示例，并输出磁盘路径。请务必替换<pathToVHD>为您的实际 VHD 路径。

> Write-Output "\\.\PhysicalDrive$((Mount-VHD -Path <pathToVHD> -PassThru | Get-Disk).Number)"

您可以使用上面的输出来获取此 VHD 的磁盘路径，然后按照上一节中的说明将其挂载到 WSL。

您还可以使用此技术挂载其他 WSL 发行版的虚拟硬盘并与之交互，因为每个 WSL 2 发行版都通过名为：ext4.vhdx. 默认情况下，WSL 2 发行版的 VHD 存储在以下路径中：C:\Users\[user]\AppData\Local\Packages\[distro]\LocalState\[distroPackageName]，请谨慎访问这些系统文件，这是一个高级用户工作流程。确保wsl --shutdown在与此磁盘交互之前运行以确保该磁盘未在使用中。

1.7 命令行参考

挂载特定的文件系统, 默认情况下，WSL2 将尝试将设备挂载为 ext4。要指定另一个文件系统，请运行：

> wsl --mount <DiskPath> -t <FileSystem>

例如，要将磁盘挂载为 fat，请运行：

> wsl --mount <Diskpath> -t vfat

要列出 WSL2 中的可用文件系统，请运行：cat /proc/filesystems

当磁盘已通过 WSL2（Linux 文件系统）挂载后，无法再通过 Windows 文件系统上的 ext4 驱动程序挂载。

1.8 挂载特定分区

默认情况下，WSL 2 会尝试挂载整个磁盘。要挂载特定分区，请运行：

> wsl --mount <Diskpath> -p <PartitionIndex>

这仅在磁盘是 MBR（主引导记录）或 GPT（GUID 分区表）时才有效。阅读有关分区样式 - MBR 和 GPT 的信息。

https://docs.microsoft.com/en-us/windows-server/storage/disk-management/initialize-new-disks#about-partition-styles---gpt-and-mbr

1.9 指定挂载选项

要指定挂载选项，请运行：

> wsl --mount <DiskPath> -o <MountOptions>

> wsl --mount <DiskPath> -o "data=ordered"

注意: 目前仅支持文件系统特定选项。ro, rw, noatime, ...不支持诸如此类的通用选项。

1.a 连接磁盘而不安装它

如果上述任何选项都不支持磁盘方案，您可以通过运行将磁盘附加到 WSL 2 而无需安装它：

> wsl --mount <DiskPath> --bare

这将使块设备在 WSL 2 中可用，因此可以从那里手动安装。使用lsblk列出内部WSL 2可用块设备。

1.b 分离磁盘

要从 WSL 2 分离磁盘，请运行：

> wsl --unmount [DiskPath]

如果Diskpath省略，则卸载并分离所有附加的磁盘。

注意: 如果一个磁盘卸载失败，可以通过运行强制退出 WSL 2 wsl --shutdown，这将分离磁盘。

1.c 限制

目前，只能将整个磁盘附加到 WSL 2，这意味着不可能只附加一个分区。具体来说，这意味着无法wsl --mount用于读取引导设备上的分区，因为该设备无法与 Windows 分离。

目前不支持 USB 闪存驱动器和 SD 卡，并且无法连接到 WSL 2。但支持 USB 磁盘。

只有内核本身支持的文件系统才能通过wsl --mount. 这意味着无法通过调用来使用已安装的文件系统驱动程序（例如 ntfs-3g）wsl --mount。

2. linux-reader(只读)

https://www.diskinternals.com/linux-reader/

从 Windows 访问 Ext、UFS、HFS、ReiserFS 或 APFS 文件系统上的文件和文件夹

Linux Reader™ 是一种流行的免费软件产品，它仍然是非商业免费软件。从 4.0 版开始，Linux Reader Pro™ 提供了额外的功能。

使用 Linux Reader Pro™，您可以从更多文件系统读取文件、通过 SSH 连接进行远程访问、创建虚拟驱动器、通过 FTP 导出文件等等。

Linux Reader™ 的所有重要功能仍然免费：没有烦人的广告、没有试用模式、没有限制。
Linux Reader™ 和 Linux Reader Pro™ 都为您提供对源驱动器的安全只读访问。
Linux Reader™ 和 Linux Reader Pro™ 绕过文件安全策略，因此您可以访问 Linux 磁盘上的任何文件。
Linux Reader™ 和 Linux Reader Pro™ 的系统要求：Windows 7、8 或 10。

3. 商业软件

3.1 paragon

https://www.paragon-software.com/zh/home/

3.2 UFS Explorer

https://uk.wikipedia.org/wiki/UFS_Explorer

https://www.sysdevlabs.com/line-ufs.php

http://www.ufsexplorer.com/

4. ext2read

https://www.appinn.com/ext2explore/

Ext2explore 是一款可以在 Windows 下浏览 ext2/3/4 分区的软件，小巧好用。

https://sourceforge.net/projects/ext2read/files/

https://github.com/mregmi/ext2read

5. Ext2Fsd

正如其名称, 仅适用于Ext2.

https://zh.wikipedia.org/wiki/Ext2Fsd

https://en.wikipedia.org/wiki/Ext2Fsd

https://github.com/matt-wu/Ext3Fsd

稳定版本 0.6.9（2017年11月2日，3年前）

Ext2Fsd（Ext2 File System Driver 的缩写）是一个免费的可安装文件系统驱动程序，用C 语言编写，用于Microsoft Windows操作系统系列。它有助于对ext2、ext3和ext4 文件系统的读写访问。

错误

德国电脑杂志PC-WELT曾报道2009年程序崩溃频繁，程序无法顺利访问ext3分区。这常常导致蓝屏。这种类型的崩溃可能导致数据丢失，例如，如果主存储器中还没有永久存储的数据。该程序只能访问 ext2 分区而不会出错。

2012 年，Computerwoche警告说，访问 ext3 分区“并非无害”。可能会发生数据丢失。

严重错误

2017 年 11 月 2 日，发布了 0.69 版的警告：

不要在最新的 Ubuntu 或 Debian 系统上使用 Ext2Fsd 0.68 或更早版本。Ext2Fsd 0.68 无法在启用 64 位模式的情况下处理 EXT4，然后它可能会损坏您的数据。非常抱歉这个灾难问题，我正在努力改进。

虽然尚不清楚 v0.69 是否纠正了这一缺陷，但用户报告即使使用 0.69 版本，Windows 10 也会提示他们格式化 ext4 驱动器。已知的解决方案是将所述 ext4 驱动器转换为 32 位版本。

6. 文件系统对比

https://zh.wikipedia.org/wiki/文件系统的对比

https://en.wikipedia.org/wiki/Comparison_of_file_systems

2021-07-01

Festival

1. Installation
2. Configuration配置
	2.1 Sound server 声音服务器
	2.2 Voices声音
	2.3 Manually手动
3. Usage用法
	3.1 使用festival
	3.2 Interactive交互的
	3.3 添加帮助信息
4. Troubleshooting故障排除
	4.1 无法打开 /dev/dsp
	4.2 Alsa 以错误的速度播放
	4.3 找不到命令 aplay
	4.4 Say报错
	4.5. Server
5 Speech-synthesizers语音合成器
	5.1 Arch库含有的
	5.2. 包含/usr/bin/命令

https://wiki.archlinux.org/title/Festival

https://github.com/festvox/

http://festvox.org/docs/manual-2.4.0/

注: 上面官方手册是2014年的2.4版本; 当前安装的是2.5版本(2017?)...

Festival是CSTR（语音技术研究中心）开发的通用多语言语音合成系统。它提供了构建语音合成系统的通用框架，并包含各种模块的示例。总的来说，它通过许多 API 提供全文到语音:从 shell 级别，通过 Scheme 命令解释器，作为 C++ 库，从 Java 和 Emacs 接口。Festival是多语言的（目前有英式英语、美式英语、意大利语、捷克语和西班牙语，其他语言在原型中可用。）

1. Installation

$ sudo pacman -Ss festival

extra/festival 2.5.0-4 [installed]

A general multi-lingual speech synthesis system

community/festival-english 2.5-2

British and American English Male speaker

community/festival-us 2.5-2

American Male/Female and Scottish English Male speaker

2. Configuration配置

没有全局/etc/配置文件，但您可以使用您的~/.festivalrc文件配置festival，或直接编辑/usr/share/festival/festival.scm. 这两个都是方案文件，使用方案语法并在每次festival运行时重新运行。

2.1 Sound server 声音服务器

如果来自其他来源的音频已经在播放，则以下内容允许 Festival 工作。添加到您的配置:

对于 PulseAudio:

(Parameter.set 'Audio_Required_Format'aiff)

(Parameter.set 'Audio_Method 'Audio_Command)

(Parameter.set 'Audio_Command "paplay $FILE --client-name=Festival --stream-name=Speech")

对于 ALSA:

(Parameter.set 'Audio_Method 'Audio_Command)

(Parameter.set 'Audio_Command "aplay -q -c 1 -t raw -f s16 -r $SR $FILE")

2.2 Voices声音

Arch 将官方语音集分为festival-us (recommended) and festival-english ...

要查看当前安装了哪些声音以及默认设置是什么，请首先进入 Festival 的#Interactive shell（REPL 方案）。要永久更改默认语音，请将其添加到您的配置中，例如:

(set! voice_default voice_cmu_us_rms_cg)

附加到/usr/share/festival/siteinit.scm适用于所有用户。

添加到.festivalrc后, 重新进入, 显示默认声音时会提示...没有定义的错误,但可以正常使用:

festival> voice_default

#<CLOSURE n (let-internal (me) (voice_cmu_us_slt_cg) (begin (require "/usr/share/festival/voices/us/cmu_us_slt_cg/festvox/cmu_us_slt_cg") (if (eq me voice_cmu_us_slt_cg) (error (string-append "autoload: \"" "/usr/share/festival/voices/us/cmu_us_slt_cg/festvox/cmu_us_slt_cg" ".scm\" does not define " (quote voice_cmu_us_slt_cg)))) (apply voice_cmu_us_slt_cg n)))>

2.3 Manually手动

您也可以直接从 Festvox 获得声音。您需要解压缩包含语音的文件夹并将其移动到其中，/usr/share/festival/voices/而判断包含语音的文件夹的方法是在其中查找festvox/子文件夹。然后，您可以通过加载festival提示来测试是否找到了您的新声音。

3. Usage用法

3.1 使用festival

测试:

$ echo "This is a test!" |festival --tts

读取文本文件:

$ festival --tts /home/tom/sptext.txt

要阅读您用光标突出显示的选择:

$ xsel |festival --tts

注: xsel是用于获取和设置 X 选择的内容命令行程序, 安装:$ sudo pacman -S xsel

将文本文件转换为 mp3 音频:

$ text2wave /home/tom/LoveOurCountry.txt | lame - text.mp3

Txt文件: lines: 19; Words: 294; char: 1554; Bytes: 1556;

Mp3文件: size: 291.8Kb; 时长: 01:39

用选择的声音录制音频:

$ text2wave -o output.wav -eval '(voice_cmu_us_awb_cg)' /home/tom/LoveOurCountry2.txt

Txt文件: lines: 7; Words: 279; char: 1525; Bytes: 1529;

Wav文件: size: 3.1Mb; 时长: 01:41

语音报时:

$ saytime

The time is now, almost twenty-five past 4, in the afternoon.

$ saytime

The time is now, exactly twenty-five past 4, in the afternoon.

$ saytime

The time is now, just after twenty-five past 4, in the afternoon.

3.2 Interactive交互的

Festival 有一个交互式提示，可用于测试。键入festival以输入它。以下是一些示例:

显示默认声音:

festival> voice_default

voice_kal_diphone

列出可用的声音:

festival> (voice.list)

(rab_diphone kal_diphone cmu_us_rms_cg cmu_us_slt_cg cmu_us_awb_cg)

要选择另一种声音，请输入。例如: (voice_name)

festival> (voice_cmu_us_rms_cg)

cmu_us_rms_cg

听它说话:

festival> (SayText "Arch makes me happy")

列出可用命令:

festival> help

退出:

festival> (quit)

3.3 添加帮助信息

/usr/share/festival/festdoc.scm

配置文件的(defvar help这部分就是帮助信息了.

在初始默认声音下面,增加新安装的声音名称

(voice_kal_diphone) Select voice (American Male)

(voice_cmu_us_rms_cg) Select voice (US Male s)

(voice_cmu_us_slt_cg) Select voice (US Female)

(voice_cmu_us_awb_cg) Select voice (Scottish Male)

再次进入festival, 获取帮助就能看到这些选择的提示了

festival> help

4. Troubleshooting故障排除

4.1 无法打开 /dev/dsp

如果节日返回以下错误消息:

Linux: can't open /dev/dsp

请参阅上面的: 2.1 Sound server 声音服务器

4.2 Alsa 以错误的速度播放

如果上述解决方案让您发出吱吱的声音，您可能想尝试更改您的aplay选项:

(Parameter.set 'Audio_Method 'Audio_Command)

(Parameter.set 'Audio_Command "aplay -Dplug:default -f S16_LE -r $SR $FILE")

4.3 找不到命令 aplay

安装alsa-utils包。

4.4 Say报错

festival> (SayText "Arch makes me happy")

-=-=-=-=-=- EST Warning -=-=-=-=-=-

audio_open_alsa: failed to set hw parameters. Invalid argument.

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

Segmentation fault (core dumped)

以下内容添加到.festivalrc即可

(Parameter.set 'Audio_Method 'Audio_Command)

(Parameter.set 'Audio_Command "aplay -q -c 1 -t raw -f s16 -r $SR $FILE")

4.5 Server

Install festival-freebsoft-utils(aur) to use Festival with speech-dispatcher (i.e. in Firefox's Reader).

5. Speech-synthesizers语音合成器

https://wiki.archlinux.org/title/List_of_applications#Speech_synthesizers

https://en.wikipedia.org/wiki/Comparison_of_speech_synthesizers

5.1 Arch库含有的

festival - 构建语音合成系统的通用框架以及各种模块的示例。总的来说，它提供全文到语音。

https://www.cstr.ed.ac.uk/projects/festival/

espeak — 适用于 50 多种语言的紧凑型语音合成器。

http://espeak.sourceforge.net/

espeak-ng - eSpeak 的分支（由于原始维护者不活动）。

https://github.com/espeak-ng/espeak-ng

orca — 使用 eSpeak（通过 Speech Dispatcher）为盲人或视障人士提供的屏幕阅读器。

https://wiki.gnome.org/Projects/Orca

flite - 轻量级语音合成引擎。

http://festvox.org/flite/

kmouth — 语音合成器前端，使无法说话的人可以让他们的计算机说话。

https://apps.kde.org/kmouth/

speech-dispatcher - 语音合成的通用接口。它有 eSpeak、Festival 和其他一些语音合成器的后端。

https://freebsoft.org/speechd

5.2 包含/usr/bin/命令

espeak : espeak

espeak-ng : espeak-ng

espeak-ng : speak-ng

orca : orca

flite : flite

flite : flite_cmu_us_kal16

flite : flite_cmu_us_slt

kmouth : kmouth GUI图形界面

speech-dispatcher : spd-conf

speech-dispatcher : spd-say

speech-dispatcher : spdsend

speech-dispatcher : speech-dispatcher

speech-dispatcher usr/lib/systemd/system/speech-dispatcherd.service

订阅：博文 (Atom)

Picture	https://trac.ffmpeg.org/wiki/AudioChannelManipulation
	[1.1-4] stereo → mono stream Downmix both channels 下缩两个通道 Use -ac 将单个立体声流混合成单声道流。立体声流的两个通道都将被缩混到流中： $ ffmpeg -i stereo.flac -ac 1 mono.flac 警告：任何异相立体声都会抵消。以下滤波器图可用于在缩混之前使立体声同相异相: -af "asplit[a],aphasemeter=video=0,ametadata=select:key=lavfi.aphasemeter.phase:value=-0.005:function=less,pan=1c\|c0=c0,aresample=async=1:first_pts=0,[a]amix"
	[1.2] 立体声 → 单声道 Choose a specific channel 选择特定频道 Use channelsplit or pan 此示例使用 channelsplit 音频过滤器仅包含正确的通道： $ ffmpeg -i stereo.wav -filter_complex "[0:a]channelsplit=channel_layout=stereo:channels=FR[right]" -map "[right]" front_right.wav $ ffmpeg -i stereo.wav -af "pan=mono\|c0=c1" mono.m4a 或者，您可以c0=FR改用。如果想要左声道，请使用c0=c0或c0=FL。
	[2-5] stereo → 2 × mono files Use channelsplit or -map_channel or pan 使用 channelsplit 音频过滤器将立体声输入中的每个通道输出到单独的单声道文件： $ ffmpeg -i stereo.wav -filter_complex "[0:a]channelsplit=channel_layout=stereo[left][right]" -map "[left]" left.wav -map "[right]" right.wav $ ffmpeg -i stereo.wav -map_channel 0.0.0 left.wav -map_channel 0.0.1 right.wav $ ffmpeg -i stereo.wav -filter_complex "[0:a]pan=1c\|c0=c0[left];[0:a]pan=1c\|c0=c1[right]" -map "[left]" left.wav -map "[right]" right.wav
	[3] stereo → 2 × mono streams Use channelsplit 使用 channelsplit 音频过滤器将立体声输入中的每个通道输出到一个输出文件中的单个单声道流： $ ffmpeg -i in.mp3 -filter_complex "[0:a]channelsplit=channel_layout=stereo" output.mka
	[4-1.1] mono → stereo Use -ac or amerge 从一个单声道输入创建立体声输出： $ ffmpeg -i input.mp3 -ac 2 output.m4a $ ffmpeg -i input.mp3 -filter_complex "[0:a][0:a]amerge=inputs=2[a]" -map "[a]" output.m4a 注意：这些示例不会从单声道输入神奇地创建“真正的”立体声输出，而只是将相同的音频放入输出的左右声道（两个声道将相同）。
	[5-2] 2 × mono → stereo Use join or amerge 使用 join 音频过滤器从两个单声道输入创建立体声输出： $ ffmpeg -i left.mp3 -i right.mp3 -filter_complex "[0:a][1:a]join=inputs=2:channel_layout=stereo[a]" -map "[a]" output.mp3 $ ffmpeg -i left.mp3 -i right.mp3 -filter_complex "[0:a][1:a]amerge=inputs=2[a]" -map "[a]" output.mka
	[10] stereo → stereo Mix both stereo channels to stereo 两个立体声通道混合为立体声 pan 输出的左右声道将分别包含输入的左右声道： $ ffmpeg -i input.mp3 -af "pan=stereo\|c0<c0+c1\|c1<c0+c1" output.ogg
	[11] Switch stereo channels 切换立体声通道 Use channelmap or pan or -map_channel 使用 channelmap 音频过滤器将左声道切换到右声道和右声道切换到左声道： $ ffmpeg -i stereo.mp3 -filter_complex "channelmap=map=FL-FR\|FR-FL:channel_layout=stereo" output.mp3 $ ffmpeg -i stereo.ogg -af pan=stereo\|c0=c1\|c1=c0 output.wav $ ffmpeg -i stereo.ogg -map_channel 0.0.1 -map_channel 0.0.0 output.wav
	[12] Mute a channel 静音 Use pan or -map_channel 此示例使用 pan 音频过滤器将第一个通道（左前）静音，但保持第二个通道（右前）不变： $ ffmpeg -i stereo.wav -af "pan=stereo\|c1=c1" output.wav $ ffmpeg -i stereo.wav -map_channel -1 -map_channel 0.0.1 output.wav

Picture	https://trac.ffmpeg.org/wiki/AudioChannelManipulation
	[8] 5.1 → stereo Use -ac or pan 要缩混，您可以简单地使用-ac 2： $ ffmpeg -i 6channels.wav -ac 2 stereo.wav 注意: 默认情况下，使用-ac 2LFE 通道时省略。请参见“数字音频压缩标准（文件A / 52：2012） ”，部分6.1.12和7.8的更多信息缩混。 http://atsc.org/wp-content/uploads/2015/03/A52-201212-17.pdf ffmpeg集成了一个默认的向下混音（和向上混音）系统，-ac除非您有非常特殊的需求，否则该系统应该优先于（选项）而不是 pan 过滤器。如果您想映射特定频道并删除其余频道，您可以使用 pan 音频过滤器。这会将FL输入的（左前）映射到 FL输出的，并将输入的FR（右前）映射到FR输出的： $ ffmpeg -i 6channels.wav -af "pan=stereo\|c0=FL\|c1=FR" stereo.wav 您还可以按编号映射特定频道。此示例将输入的第一个和第三个通道映射到输出的第一个和第二个通道。 $ ffmpeg -i 6channels.wav -af "pan=stereo\|c0=c0\|c1=c2" output.wav 如果将=通道规范中的替换为<，则该规范的增益将被重新归一化，使总数为 1，从而避免削波噪声。有关其他信息和示例，请参阅声像音频过滤器文档。 https://ffmpeg.org/ffmpeg-filters.html#pan
	[9.1] 2 × stereo → stereo (a.fl + b.fl → c.FL; a.fr + b.fr → c.FR) Use amerge和pan or -ac 使用amerge和pan音频过滤器将两个立体声输入合并为一个立体声输出： $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2,pan=stereo\|c0<c0+c2\|c1<c1+c3[a]" -map "[a]" output.mp3 $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2[a]" -map "[a]" -ac 2 output.mp3 注意：使用 pan 音频过滤器产生的输出可能与使用产生的输出不同-ac 2，因此您必须聆听输出或查看音频统计信息，以确定哪种输出适合您. https://trac.ffmpeg.org/wiki/AudioChannelManipulation#Statistics
	[9.2] (a.fl + fr → c.FL; b.fl + fr → c.FR) Use amerge和pan 与上面类似的情况，而是使用第一个输入的左右声道使左声道输出，并使用第二个输入的左右声道使输出的右声道。只需更改平移过滤器中的通道规格： $ ffmpeg -i input1.wav -i input2.wav -filter_complex "[0:a][1:a]amerge=inputs=2,pan=stereo\|c0<c0+c1\|c1<c2+c3[a]" -map "[a]" output.mp3 在这种情况下必须使用声像音频过滤器，而不是-ac 2与前面的示例不同。