将完整文件名拆分为各部分

4
我正在创建一个函数,用于将完整的Unix文件名(如/home/earlz/test.bin)拆分为其各个部分。我已经编写了一个函数,对前两个部分起作用很好,但在此之后它会产生错误的输出...
strlcpy_char将使用term作为终止符复制字符串,并且还会复制0。如果以term结尾,则term将是字符串的最后一个字符,然后是null。
返回trg字符串长度...
int strlcpy_char(char *trg,const char *src,int max,char term){
    int i;
    if(max==0){return 0;}
    for(i=0;i<max-1;i++){
            if(*src==0){
                    *trg=0;
                    return i;
            }
            if(*src==term){
                    *trg=term;
                    trg++;
                    *trg=0; //null terminate
                    return i+1;
            }
            *trg=*src;
            src++;
            trg++;
    }
    *trg=0;
    return max; 
}

.

int get_path_part(char *file,int n,char *buf){
    int i;
    int current_i=0;
    //file is assumed to start with '/'so it skips the first character.
    for(i=0;i<=n;i++){
            current_i++;
            current_i=strlcpy_char(buf,&file[current_i],MAX_PATH_PART_SIZE,'/');
            if(current_i<=1){ //zero length string..
                    kputs("!"); //just a debug message. This never happens with the example
                    return -1; //not enough parts to the path
            }
    }
    if(buf[current_i-1]=='/'){
            return 1; //is not the last part
    }else{
            return 0; //is the last part(the file part)
    }
}

我使用这段代码来进行测试:

        kputs("test path: ");
        kgets(cmd);
        kputs("\n");
        char *tmp=malloc(256);
        int i=0;
        get_path_part(cmd,i,tmp);
        kputs(tmp);
        kputs("\n");
        i=1;
        get_path_part(cmd,i,tmp);
        kputs(tmp);
        kputs("\n");
        i=2;
        get_path_part(cmd,i,tmp);
        kputs(tmp);
        kputs("\n");

当我尝试类似于“/home/test.bin”这样的内容时,输出正确为:
/home
/test.bin
但是当我尝试“/home/earlz/test.bin”时,输出为:
/home
/earlz
/arlz
有人看出我的代码问题了吗?我一直在寻找,但就是找不到问题。
此外,在你说“但是有一个库可以解决这个问题”之前,我要声明,我正在操作系统内核中进行操作,因此我几乎没有标准库。我只有一些string.h的部分内容,那就是所有标准库的全部了。
7个回答

4

在路径遍历过程中,您将current_i覆盖而不是将其相加。

因此,

current_i++;
current_i=strlcpy_char(buf,&file[current_i],MAX_PATH_PART_SIZE,'/');

应该真正是

current_i += strlcpy_char(buf,&file[current_i+1],MAX_PATH_PART_SIZE,'/');

2

我认为你需要追踪当前的i,因为从strlcpy返回的最大值并不知道你在整个文件字符串中的位置。这样说通了吗?

current_i=strlcpy_char(buf,&file[current_i],MAX_PATH_PART_SIZE,'/');

我认为当我在输入答案时,Tobiesque也提到了同样的观点。他是正确的。给他加1分。 - Ryan Oberoi

2

您是否需要做类似以下的操作:

tocurrent_i += strlcpy_char...

替代

tocurrent_i = strlcpy_char...

啊,太晚了。+1 给 Tobuesque :) - Igor Krivokon

0

你的代码需要是可重入的吗?如果不需要,可以使用 strings.h 中的 strtok 函数。

STRTOK(P)

NAME
       strtok, strtok_r - split string into tokens

SYNOPSIS
       #include <string.h>

       char *strtok(char *restrict s1, const char *restrict s2);

       char *strtok_r(char *restrict s, const char *restrict sep,
              char **restrict lasts);

虽然没有评论你的代码,抱歉:)


我不认为我想要自己实现它(因为我需要将其从其他地方移植过来以便在我的内核上编译)。而且,我的代码必须是可重入的...它将成为所有类型进程在任何未知时间使用的文件系统驱动程序的一部分... - Earlz

0

这是我会做的方式

char ** split_into_parts(char *path) {
  char ** parts = malloc(sizeof(char *) * 100);
  int i = 0;
  int j = 0;

  if (*path == '/') {
    path++;
  }

  parts[0] = 0;
  while (*path) {
    if (*path == '/') {
      parts[i][j] = 0;
      i++;
      parts[i] = 0;
      j = 0;
    } else {
      if (parts[i] == 0) {
        parts[i] = malloc(sizeof(char) * 100);
      }
      parts[i][j] = *path;
      j++;
    }
    path++;
  }
  parts[i+1] = 0;

  return parts;
}

0

尝试使用我下面的代码。

如果您需要标准C函数的实现(例如strchr()),请尝试koders.com或只需在Google上搜索strchr.c。

#include <stdio.h>
#include <string.h>

const char *NextToken(const char *pStart, char chSep, char *pToken, size_t nTokMax)
{
    const char *pEnd;
    size_t nLength;

    /* set output to empty */
    *pToken=0;

    /* make sure input is OK */
    if (!pStart || *pStart!=chSep)
        return NULL;

    /* find end of token */
    pEnd = strchr(pStart+1, chSep);
    if (pEnd)
        nLength = pEnd - pStart;
    else
        nLength = strlen(pStart);

    if (nLength >= nTokMax) /* too big */
        return NULL;

    strncpy(pToken, pStart, nLength);
    pToken[nLength] = 0;

    return pEnd;
}

int main()
{
    #define BUFFSIZE 256
    char cmd[BUFFSIZE];
    char tmp[BUFFSIZE];
    const char *pStart=cmd;
    int i=0;

    puts("test path: ");
    fgets(cmd, BUFFSIZE, stdin);
    puts("");

    do {
        pStart = NextToken(pStart, '/', tmp, BUFFSIZE);
        if (tmp[0])
            puts(tmp);
    } while (pStart);
    return 0;
}

0
如果您正在使用Glib,g_strsplit非常好用且易于使用。

操作系统内核。没有我自己实现的库。 - Earlz

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接