JavaScript分割数组

4
我正在尝试编写一个自定义字符串分割函数,比我想象的更难。
基本上,我传入一个字符串和一个值数组,它将返回一个子字符串数组,删除空字符串并包括它所分割的值。如果同一位置可以被两个不同的值分割,则以较长的为准。
也就是说,
split("Go ye away, I want some peace && quiet. & Thanks.", ["Go ", ",", "&&", "&", "."]);

应该返回

["Go ", "ye away", ",", " I want some peace ", "&&", " quiet", ".", " ", "&", " Thanks", "."]

你能想到一个相对简单的算法来实现这个功能吗?如果Javascript中有内置的方法可以做到这一点(我不认为有),那就更好了。


你是不是想把“ ”作为你的分隔符之一?你的输出似乎表明了这一点,但你的输入并没有。 - Raul Agrait
@kingjiv 是的,那是一个错误。现在应该已经修复了。 - Peter Olson
1
这个可能有什么使用案例呢? - Lightness Races in Orbit
@Tomalak 这涉及到解析。 - Peter Olson
@Peter:你能不能再模糊一点? - Lightness Races in Orbit
显示剩余4条评论
2个回答

6

这个一样的东西吗?

function mySplit(input, delimiters) {

    // Sort delimiters array by length to avoid ambiguity
    delimiters.sort(function(a, b) {
       if (a.length > b.length) { return -1; }
       return 0;
    }

    var result = [];

    // Examine input one character at a time
    for (var i = 0; i < input.length; i++) {
        for (var j = 0; j < delimiters.length; j++) {
            if (input.substr(i, delimiters[j].length) == delimiters[j]) {

                // Add first chunk of input to result
                if (i > 0) {
                    result.push(input.substr(0, i));
                }
                result.push(delimiters[j]);

                // Reset input and iteration
                input = input.substr(i + delimiters[j].length);
                i = 0;
                j = 0;
            }
        }
    }

    return result;
}

var input      = "Go ye away, I want some peace && quiet. & Thanks.";
var delimiters = ["Go ", ",", "&&", "&", "."];

console.log(mySplit(input, delimiters));
// Output: ["Go ", "ye away", ",", " I want some peace ",
//          "&&", " quiet", ".", " ", "&", " Thanks", "."]

它能工作,太棒了!我感到有些尴尬...它的大小只有我自己的解决方案的三分之一,而我的解决方案并没有正确地工作。 - Peter Olson
1
如果出现冲突,这不会优先考虑更长的分隔符(我认为这是问题中的要求)。如果您在分隔符数组中切换“&&”和“&”,它将在“&”上拆分而不是“&&”。 - Bob
确实。它具有从左到右的优先级。如果OP需要不同的语义,他可以按长度对分隔符列表进行排序。但是这在问题中没有说明,并且给定的分隔符列表中没有歧义。 - Lightness Races in Orbit
[编辑:哦,问题中已经说明了!我会添加排序。谢谢@Bob!] - Lightness Races in Orbit

4

需要的确切解决方案:

function megasplit(toSplit, splitters) {
    var splitters = splitters.sorted(function(a,b) {return b.length-a.length});
                                                          // sort by length; put here for readability, trivial to separate rest of function into helper function
    if (!splitters.length)
        return toSplit;
    else {
        var token = splitters[0];
        return toSplit
            .split(token)             // split on token
            .map(function(segment) {  // recurse on segments
                 return megasplit(segment, splitters.slice(1))
             })
            .intersperse(token)       // re-insert token
            .flatten()                // rejoin segments
            .filter(Boolean);
    }
}

演示:

> megasplit(
      "Go ye away, I want some peace && quiet. & Thanks.",
      ["Go ", ",", "&&", "&", "."]
  )
["Go ", "ye away", ",", " I want some peace ", "&", "&", " quiet", ".", " ", "&", " Thanks", "."]

机械(可重复使用!):

Array.prototype.copy = function() {
    return this.slice()
}
Array.prototype.sorted = function() {
    var copy = this.copy();
    copy.sort.apply(copy, arguments);
    return copy;
}
Array.prototype.flatten = function() {
    return [].concat.apply([], this)
}
Array.prototype.mapFlatten = function() {
    return this.map.apply(this,arguments).flatten()
}
Array.prototype.intersperse = function(token) {
    // [1,2,3].intersperse('x') -> [1,'x',2,'x',3]
    return this.mapFlatten(function(x){return [token,x]}).slice(1)
}

注:


如果按照规范的分割行为,则为1行代码:

Array.prototype.mapFlatten = function() {
    ...
}
function megasplit(toSplit, splitters) {
    return splitters.sorted(...).reduce(function(strings, token) {
        return strings.mapFlatten(function(s){return s.split(token)});
    }, [toSplit]);
}

如果上面的内容难以理解,这里是3句话概括:

Array.prototype.mapFlatten = function() {
    ...
}
function megasplit(toSplit, splitters) {
    var strings = [toSplit];
    splitters.sorted(...).forEach(function(token) {
        strings = strings.mapFlatten(function(s){return s.split(token)});
    });
    return strings;
}

这怎么是“所请求的确切解决方案”?你的输出不匹配。 - Lightness Races in Orbit

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接