下了一堆小说,每部都是一个txt文件,放到手机上看不方便,需要把它们按章节分割开来,文件名要是章节名称,不但要文件名是章节名称,而且要每部小说分别放到同名的文件夹里去。手动分割是不可能的,太麻烦了。程序员嘛,就要编程来解决。
看起来难度挺高的,所以我准备写脚本来解决了,开始尝试用grep、do、while、read、sed判断每行内容分别处理,之前折腾合并字幕时,就觉得这样很慢很没效率,那是觉得awk相当的强悍,折腾了半天,查了无数次手册,最后还是一句awk命令解决。
注意:因为WPMU有讨厌的引号转换问题,目前无法解决,所以下面有几个命令因引号被转换成中文引号而失效,点击这里查看脚本原文 Read the rest of this entry »
今天看到骨头兄的《一个命令把几千张照片压缩了》,我也在用相似的命令,我一句命令把几十本pdf格式的小说转换成txt,再一句命令把所有txt都格式化好。
之所以把pdf转成txt,是我打算放到手机上看,我这等穷人买不起支持pdf的手机,只好最大限度榨取手机的剩余价值了。在乘地铁的无聊时打发时间,话说我是很少在电脑上看小说的, 有电脑用当然做些只能电脑做的事。
虽然很多网站号称提供txt小说下载,不过很多格式都很乱,还到处插上自己的网址,还不如自己下载pdf自己转换整理。 Read the rest of this entry »
很久之前写过怎么把多个字幕合并在在一起,也就是中英双语啦,用mplayer载入,试过cat来暴力合并,即把第二个字幕直接附加到第一个字幕的底部
cat chs.srt eng.srt > chs-eng.srt
可惜显示不正常,所以才用diff法来合并。其实用cat方法是可行了,mplayer命令加上参数”-overlapsub“就行了(之前是用“overlapsub=1”才出错了)。
注意:博客系统有问题,自动把英文引号转换成中文引号了,用时记得改回去。
Read the rest of this entry »