我希望剥离几百个文件中的HTML标签。
这是我开始使用的命令:
find -name *.html -exec w3m {} > w3m {}.html.out \;
我遇到的问题是它创建了一个单独的大的.htm.out文件(命名为{}.html.out) - 我希望我使用的文件被命名为其原始名称.out。
例如,我有
2002/filename.html
我希望通过w3m运行它,并获得2002/filename.html.out。
有什么建议吗?我也可以接受其他不使用bash的解决方案。
我正在使用cygwin。