我有一个网站,用户可以使用自定义的 TinyMCE 实现发布帖子(例如论坛、评论等)。许多用户喜欢从 Word 复制粘贴,这意味着他们的输入通常带有大量相关联的 MS 内联格式。
我不能仅仅去掉
是否有人知道一个库/类/函数可以为我解决这个问题?虽然我找不到任何确定的东西,但这一定是一个常见的问题。我最近一直在思考,寻找 MS 特定模式的暴力正则表达式可能会解决这个问题,但我不想重新编写已经存在的代码,除非必须。
此外,修复引号、破折号等也很重要。我现在有自己的工具来完成这项工作,但我真的只想找到一个 MS 转换过滤器来解决所有问题。
我不能仅仅去掉
<span whatever>
,因为 TinyMCE 依赖于 span 标签进行一些格式化,并且我不能(也不想)强制用户使用 TinyMCE 的“从 Word 粘贴”功能(无论如何,这个功能似乎不太好用)。是否有人知道一个库/类/函数可以为我解决这个问题?虽然我找不到任何确定的东西,但这一定是一个常见的问题。我最近一直在思考,寻找 MS 特定模式的暴力正则表达式可能会解决这个问题,但我不想重新编写已经存在的代码,除非必须。
此外,修复引号、破折号等也很重要。我现在有自己的工具来完成这项工作,但我真的只想找到一个 MS 转换过滤器来解决所有问题。