递归BBCode解析

3

我正在尝试在我的脚本中解析BBCode。现在,它可以无缝运行,直到我尝试缩进更多的BBCode,例如spoiler、url、字体大小等等,然后就出问题了。这是我的代码:

function parse_bbcode($text) {
    global $db;
    $oldtext = $text;
    $bbcodes = $db->select('*', 'bbcodes');
    foreach ($bbcodes as $bbcode) {
        switch ($bbcode->type) {
            case 'simple': {
                $find = '{content}';
                $replace = '${1}';
                $text = preg_replace(
                    '/\['.$bbcode->tag.'\](.+)\[\/'.$bbcode->tag.'\]/i',
                    str_replace($find, $replace, $bbcode->html),
                    $text);
                    break;
            }
            case 'property':
            case 'options': {
                $find = array ( '{property}', '{content}' );
                $replace = array ( '${1}', '${2}' );
                $text = preg_replace(
                    '/\['.$bbcode->tag.'\=(.[^\"]*)\](.+)\[\/'.$bbcode->tag.'\]/i',
                    str_replace($find, $replace, $bbcode->html),
                    $text);
                    break;
            }
        }
    }
    return $text;
}

我猜测正则表达式在模式的递归上有问题。如何改进它?样例 $bbcode 对象如下:

stdClass::__set_state(array(
   'id' => '2',
   'name' => 'Italic',
   'type' => 'simple',
   'tag' => 'i',
   'button_image' => NULL,
   'button_text' => '<i>I</i>',
   'options' => '',
   'prompt' => NULL,
   'html' => '<i>{content}</i>',
   'order' => '1',
))
stdClass::__set_state(array(
   'id' => '3',
   'name' => 'URL',
   'type' => 'property',
   'tag' => 'url',
   'button_image' => NULL,
   'button_text' => 'http://',
   'options' => '',
   'prompt' => 'URL address',
   'html' => '<a href="{property}">{content}</a>',
   'order' => '4',
))

9
PHP已经有BBCode解析器,因此没有必要重新发明轮子。 - Gordon
没有想到,谢谢你的提示。能否把这个作为答案,这样我就可以标记它了。 - casraf
我在下面的Clement答案中添加了一些链接。随意接受它 :) - Gordon
对于任何正在寻找的人,我想添加我编写的库,目前是我能找到的最好的:https://github.com/thunderer/Shortcode - Tomasz Kowalczyk
2个回答

7

PECL包看起来很棒,但我无法安装它... PEAR的那个太差了 :/ - casraf

0

使用正则表达式正确解析BBcode并不容易。代码可能会嵌套。 CODE标签可能包含必须被解析器忽略的BBCodes。某些标签可能不会出现在其他标签内部等等。但是,这是可以完成的。我最近为FluxBB开源论坛软件重构了BBCode解析器。您可以查看它的实际应用:

New 2011 FluxBB Parser

请注意,这个新的解析器尚未被纳入FluxBB代码库。


这个是否完全可操作?我该如何轻松地添加自己的BBCode? - casraf
是的,它正在运行中(上面的链接是一个使用此解析器的测试论坛)。这不是一个通用的解析器 - 它专门设计用于与FluxBB一起使用。您需要阅读文档源代码。我假设您是一位PHP程序员,并且熟悉正则表达式。就像我说的,解析BBCode并不是一件简单的事情。 - ridgerunner
是的,我很熟悉PHP和RegEx(请参见问题),但BBCode足够简单,可以解析 - 直到它变成递归。 - casraf
@OhMrBigshot:问题的复杂性不仅限于递归,而是标签如何嵌套在彼此内部。例如,您是否允许在IMG标签中嵌入URL标签?或者在I标签中允许QUOTE标签吗?您需要建立一套规则系统(与HTML平行),定义允许嵌套在每个标签内的内容。此外,还需要有允许父级标签的规则,例如,LI(或*)标签只能出现在LIST标签内部。 - ridgerunner

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接