我在这里有一些问题,但我是新手,不知道为什么帖子被锁定或删除:帖子
我正在使用一个WordPress数据库,里面有大约60,000个“文章”,在“post_content”栏中,我想删除那些
我在将数据库导出后,在.sql数据库上运行了该操作。但是在查看数据库后,文本仍然存在。
非常感谢任何帮助。
更新:这个问题已经被Ed Morton解决。
<p>
HTML标记以及它们之间的文本。我的文章内容看起来像这样:<p style="text-align: left;"><span style="color: #fffff;">
An entire paragraph of text around 200 words
</span></p>
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="309" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="250" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="250" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
p
标签将是相同的,并且每篇文章仅出现一次,但颜色可能在某些文章中有所不同。
期望的输出应该像这样:
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="309" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="250" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
[Text_between_brackets]
<iframe src="http://somewebsite.com" width="250" height="250" frameborder="0" marginwidth="0" marginheight="0" scrolling="NO"></iframe>
我想删除所有段落标签中的文本。因此,我想要删除的文本是“一整段大约200字的文本”。这个文本在每篇文章中都不同,但唯一不变的是开放和关闭标签<p>
。
根据上一个问题,这个命令是:由用户“PS。”
awk '/<p/,/<\/p>/{next} {print $0}' inputfile
我在将数据库导出后,在.sql数据库上运行了该操作。但是在查看数据库后,文本仍然存在。
非常感谢任何帮助。
更新:这个问题已经被Ed Morton解决。
Using GNU awk for multi-char RS this:
awk -v RS='</p>\\s*' -v ORS= '{sub(/<p.*/,"")} 1' file
awk '/<p/,/<\/p>/{next} {print $0}' test.sql > test_awk.sql
问题是当我这样做时,数据库中没有任何帖子留下。在“wp_posts”表中和“wp_options”中的所有内容都被删除了(在运行该awk命令后看起来像这样http://prntscr.com/d0uc1g) - d.ariel<p>
和</p>
之间的所有内容是微不足道的,但保留像<span...>
和</span>
这样的标记并删除其他所有内容则更加困难。但既然它们之间没有任何东西可以操作,为什么您还要保留它们呢?您的输入显示整个文件中只有1个<p>...</p>
对 - 是否真正代表您的实际数据?如果不是,请在示例中显示多个出现次数,因为这比1个更难处理。 - Ed Morton