我使用BBEdit。BBEdit支持使用GREP进行多文件搜索和替换。使用以下方法(从stackoverflow中的Notepad ++帖子复制):
(\bhref="|(?!^)\G)[^"<_]*\K_
我可以获取所有包含下划线的URL列表。想法是将所有下划线替换为破折号。这没有问题,BBEdit搜索面板有一个“替换为”字段(就像Notepad ++)。
一切都很好,但我不想实际处理所有URL。例如,应该保留文件下载URL,特别是具有.exe、.zip、.sit和.dmg扩展名的URL。实际上,我想要处理的URL是.php和.html URL。
我的意思是应该在这里找到这种类型的URL:
<a href="software/internet-tools/ftp-disk_sheet_us.php">
但不包括下面这个:
<a href="software/internet-tools/ftp-disk_us_setup.exe">
我已经尝试过编辑上面的正则表达式,但迄今为止没有成功,由于我需要在600个文件中处理大约30,000个URL,因此我真的希望确保我不会出错。
非常感谢您提前帮助我解决这个问题。