如何在C语言中比较字符串的结尾？

Question

如何在C语言中比较字符串的结尾？

57

我想确保我的字符串以“.foo”结尾。我正在使用C语言，这是我不太熟悉的语言。我找到了下面的最佳方法来实现它。有没有C语言专家能够验证我是否优雅而明智地完成了这个任务？

int EndsWithFoo(char *str)
{
    if(strlen(str) >= strlen(".foo"))
    {
        if(!strcmp(str + strlen(str) - strlen(".foo"), ".foo"))
        {
            return 1;
        }
    }
    return 0;
}

- JoeF

1

25个答案，只有4或5个没有问题。 - chqrlie

25个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Echo Liao · Answer 1

#include <assert.h>
#include <string.h>

int string_has_suffix(const char *str, const char *suf)
{
    assert(str && suf);

    const char *a = str + strlen(str);
    const char *b = suf + strlen(suf);

    while (a != str && b != suf) {
        if (*--a != *--b) break;
    }
    return b == suf && *a == *b;
}

// Test Unit
int main (int argc, char *argv[])
{
    assert( string_has_suffix("", ""));
    assert(!string_has_suffix("", "a"));
    assert( string_has_suffix("a", ""));
    assert( string_has_suffix("a", "a"));
    assert(!string_has_suffix("a", "b"));
    assert(!string_has_suffix("a", "ba"));
    assert( string_has_suffix("abc", "abc"));
    assert(!string_has_suffix("abc", "eeabc"));
    assert(!string_has_suffix("abc", "xbc"));
    assert(!string_has_suffix("abc", "axc"));
    assert(!string_has_suffix("abcdef", "abcxef"));
    assert(!string_has_suffix("abcdef", "abxxef"));
    assert( string_has_suffix("b.a", ""));
    assert( string_has_suffix("b.a", "a"));
    assert( string_has_suffix("b.a", ".a"));
    assert( string_has_suffix("b.a", "b.a"));
    assert(!string_has_suffix("b.a", "x"));
    assert( string_has_suffix("abc.foo.bar", ""));
    assert( string_has_suffix("abc.foo.bar", "r"));
    assert( string_has_suffix("abc.foo.bar", "ar"));
    assert( string_has_suffix("abc.foo.bar", "bar"));
    assert(!string_has_suffix("abc.foo.bar", "xar"));
    assert( string_has_suffix("abc.foo.bar", ".bar"));
    assert( string_has_suffix("abc.foo.bar", "foo.bar"));
    assert(!string_has_suffix("abc.foo.bar", "xoo.bar"));
    assert(!string_has_suffix("abc.foo.bar", "foo.ba"));
    assert( string_has_suffix("abc.foo.bar", ".foo.bar"));
    assert( string_has_suffix("abc.foo.bar", "c.foo.bar"));
    assert( string_has_suffix("abc.foo.bar", "abc.foo.bar"));
    assert(!string_has_suffix("abc.foo.bar", "xabc.foo.bar"));
    assert(!string_has_suffix("abc.foo.bar", "ac.foo.bar"));
    assert( string_has_suffix("abc.foo.foo", ".foo"));
    assert( string_has_suffix("abc.foo.foo", ".foo.foo"));
    assert( string_has_suffix("abcdefgh", ""));
    assert(!string_has_suffix("abcdefgh", " "));
    assert( string_has_suffix("abcdefgh", "h"));
    assert( string_has_suffix("abcdefgh", "gh"));
    assert( string_has_suffix("abcdefgh", "fgh"));
    assert(!string_has_suffix("abcdefgh", "agh"));
    assert( string_has_suffix("abcdefgh", "abcdefgh"));

    return 0;
}

// $ gcc -Wall string_has_suffix.c && ./a.out

- J. M. Becker · Answer 2

我经常检查glib字符串函数，它们有各种有用的部分。一个后缀检查函数已经存在。

gchar * str;

if (!g_str_has_suffix(str)) {
    return FALSE;
}

我对C语言还比较新，如果有不足之处请见谅...但是在我看来，这似乎是一个很好的守卫条件！

- user14773854 · Answer 3

或者...

#include <stdbool.h>
#include <stdio.h>
#include <string.h>

bool strendscmp(const char* haystack, const char* needle) {
    size_t len_str = strlen(haystack);
    size_t len_ending = strlen(needle);
    return len_str >= len_ending && strcmp(&haystack[(len_str - len_ending)], needle) == 0;
}

//SOME TESTS
int main(int argc, char** argv) {
    printf("%s\n", strendscmp("abc", "bc") ? "true" : "false"); //true
    printf("%s\n", strendscmp("abc", "d") ? "true" : "false"); //false
    printf("%s\n", strendscmp("abc", "") ? "true" : "false"); //true
    printf("%s\n", strendscmp("sumo", "omo") ? "true" : "false"); //false
    printf("%s\n", strendscmp("babbbba", "bbaabaab") ? "true" : "false"); //false
    printf("%s\n", strendscmp("dadaab", "bdadaab") ? "true" : "false"); //false
}

- Dan Olson · Answer 4

可能吧...

bool endswith (const char *str, const char *tail)
{
  const char *foo = strrstr (str, tail);
  if (foo)
  {
     const int strlength = strlen (str);
     const int taillength = strlen (tail);
     return foo == (str + strlength - taillength);
  }
  return false;
}

endswith (str, ".foo");

顺便说一下，原问题中的解决方案看起来很好，除了重复的strlen调用。

- Bob Moore · Answer 5

如果点的后面总是有一些东西，我们可以沉迷于一些指针算术：

int EndsWithFoo (char *str)
{
   int iRetVal = 0;
   char * pchDot = strrchr (str, '.');

   if (pchDot)
   {
      if (strcmp (pchDot+1, "foo") == 0)
      {
         iRetVal = 1;
      }
   }
   return iRetVal;
}

当然，您可能想添加一些strlen来检查点后面是否有内容 :-)

NB-我没有运行此代码进行检查，但它看起来还不错。

- wqwu · Answer 6

我想使用我的版本：

bool endsWith(const char *filename, const char *ext) {
    const uint len = strlen(filename);
    const uint extLen = strlen(ext);
    if (len < extLen) {
        return false;
    }
    for (uint index  = 1; index <= extLen; index++) {
        if (filename[len - index] != ext[extLen - index]) {
            return false;
        }
    }
    return true;
}

- Eyal Redler · Answer 7

我的看法是：

int string_has_suffix(const char* string, const char* suffix) {
    if (string && suffix) {
        if (strlen(string) >= strlen(suffix)) {
            const char* testLoc;
            testLoc = strrchr(string, suffix[0]);
            if (testLoc) {
                return (strcmp(suffix, testLoc) == 0);
            }
        }
    }
    return 0;
}

- nategoose · Answer 8

我只是写这个因为有人说了什么关于“最优化”的话。

#include <stdint.h>

int_fast8_f EndsWithFoo(const char *str) {
    char c;
    union {
        uint32_t u;
        char s[4];
    } sfx = { .s = { '.','f','o','o'} },
      cur = { .u = 0 };
    c = *str;
    if (0 == c) { return 0; }
    cur.s[0] = c;
    c = *++str;
    if (0 == c) { return 0; }
    cur.s[1] = c;
    c = *++str;
    if (0 == c) { return 0; }
    cur.s[2] = c;
    c = *++str;
    if (0 == c) { return 0; }
    cur.s[3] = c;
    while (1) {
        c = *++str;
        if (0 == c) {
                if (cur.u == sfx.u)
                {
                        return 1;
                } else {
                        return 0;
                }
        }
        cur.s[0] = cur.s[1];
        cur.s[1] = cur.s[2];
        cur.s[2] = cur.s[3];
        cur.s[3] = c;
    }
}

除非目标处理器几乎没有寄存器，否则不会从内存中加载任何字节超过一次。

循环中的char/byte复制应该在任何32位或更大的字目标处理器上被编译器转换为单个逻辑移位，但我编写它的方式是为了C代码不必意识到大小端。

编译器将sfx（后缀）转换为整数常量，并且等式后缀测试是单个32位整数相等性测试。

每个新字节都必须测试是否为0。虽然有一些位操作方法可以在一个字中测试0作为一个字节，但它们不能保护我们允许访问的内存之外的读取（假设str指向一个正确终止的字符字符串）。

- Zacharias · Answer 9

个人而言，我会自然地选择 plinth 的答案，它简单、优雅，不会重新发明轮子 - 这正是应该的。

然而，由于这是一个非常基本的问题，我在这里缺少的是一个尽可能简洁的解决方案，因此我想添加一个只使用指针增量/减量和比较的解决方案，不使用任何其他函数：

#define SUFFIX_MATCH           0
#define SUFFIX_NO_MATCH        1
#define SUFFIX_INVALID_STR    -1
#define SUFFIX_INVALID_SUFFIX -2
#define SUFFIX_STR_TOO_SHORT   2

int str_endswith(char *str, char *suffix) {
/* find out, if a string ends with another string

  If str ends with suffix, return zero (to mimick how strcmp() from string.h
  works), otherwise return SUFFIX_NO_MATCH; return SUFFIX_INVALID_STR or
  SUFFIX_INVALID_SUFFIX if the respective parameter is NULL or an empty
  string, return SUFFIX_STR_TOO_SHORT if the suffix is longer than str.

  This function is case-sensitive and does not care about localisation etc.
*/
  if (str == NULL || *str == 0) return(SUFFIX_INVALID_STR);
  if (suffix == NULL || *suffix == 0) return(SUFFIX_INVALID_SUFFIX);

  char *p, *q;   // pointer, query-pointer (just arbitrary names)

  // set p to the last non-zero char of str
  p = str;
  while (*p++);
  --p;

  // move p forward as many characters as suffix has
  q = suffix;
  while (*q++ && p-- != str);
  if(p < str) {
    // if suffix is longer than str, there can be no success
    return(SUFFIX_STR_TOO_SHORT);
  }

  // compare what p points to with suffix, char by char
  q = suffix;
  while (*p == *q && *p && *q) {    // mind the \0
    ++p;
    ++q;
  }

  // if strings are equal, both pointers now point to \0
  if (*p == 0 && *q == 0) return(SUFFIX_MATCH);   // success!

  return(SUFFIX_NO_MATCH);   // or no success otherwise
}

这是一个编辑，我很惭愧地承认从我的一个项目中拿走了原始代码，将其简化了太多，并没有彻底测试它；这个版本应该是非常严密的……如果我想要为更复杂的事情编写一个函数，这应该是一个很好的起点，这些事情不能轻易地通过标准库调用来覆盖。希望这可以帮助到你！

不，我没有使用“const char”，因为我在可变字符串上使用这样的函数，而这个函数返回零成功时，就像（在代码中提到的）strcmp()一样，这给了你额外的好处，如果需要的话，能够检查为什么没有匹配。

- Bi Ao · Answer 10

int strends(char* str, char* end){
    return strcmp(str + strlen(str) - strlen(end), end) == 0;
}

我发现这是实现结果最简单的方法。