hpple HTML解析库在iOS 7上无法正确解析

5
我在我的iOS应用程序中使用hpple解析库。https://github.com/topfunky/hpple 我遇到了一个问题,即解析器在iOS 7上无法正确解析我的HTML页面。它在iOS 6上被正确解析并返回对象。在iOS 7上,我只返回了部分解析和错误的解析结果。该库在iOS 7上不正确地读取HTML。我已经尝试调试该问题,并得出结论,问题出现在这个方法中。
NSArray *PerformXPathQuery(xmlDocPtr doc, NSString *query)
{
  xmlXPathContextPtr xpathCtx;
  xmlXPathObjectPtr xpathObj;

  /* Create xpath evaluation context */
  xpathCtx = xmlXPathNewContext(doc);
  if(xpathCtx == NULL)
    {
      //NSLog(@"Unable to create XPath context.");
      return nil;
    }

  /* Evaluate xpath expression */
  xpathObj = xmlXPathEvalExpression((xmlChar *)[query cStringUsingEncoding:NSUTF8StringEncoding], xpathCtx);
  if(xpathObj == NULL) {
    //NSLog(@"Unable to evaluate XPath.");
    xmlXPathFreeContext(xpathCtx);
    return nil;
  }

  xmlNodeSetPtr nodes = xpathObj->nodesetval;
  if (!nodes)
    {
      //NSLog(@"Nodes was nil.");
      xmlXPathFreeObject(xpathObj);
      xmlXPathFreeContext(xpathCtx);
      return nil;
    }

  NSMutableArray *resultNodes = [NSMutableArray array];
  for (NSInteger i = 0; i < nodes->nodeNr; i++)
    {
      NSDictionary *nodeDictionary = DictionaryForNode(nodes->nodeTab[i], nil,false);
      if (nodeDictionary)
        {
          [resultNodes addObject:nodeDictionary];
        }
    }

  /* Cleanup */
  xmlXPathFreeObject(xpathObj);
  xmlXPathFreeContext(xpathCtx);

  return resultNodes;
}

在调用此方法时,doc和query不为nil。我不知道如何记录此方法中的其他类,也不知道哪个类返回了错误的解析结果。也许问题在于苹果的libxml2.dylib库。

直到方法结束,我才确切地知道代码在做什么。由于iOS 7上的库无法解析与iOS 6相同的HTML页面,我被卡住了,非常需要帮助。

在iOS 7上,此库可以正确解析其他应用程序中的其他HTML页面。我用来启动解析器的代码是

 NSData *htmlData = [NSData dataWithContentsOfURL:dataURL];

    TFHpple *dataParser = [TFHpple hppleWithHTMLData:htmlData];

    NSString *dataXpathQueryString = @"//td[3]";
    NSArray *dataNodes = [dataParser searchWithXPathQuery:dataXpathQueryString];

    NSMutableArray *newData = [[NSMutableArray alloc] initWithCapacity:0];
    for (TFHppleElement *element in dataNodes) {

        data = [[GFCData alloc] init];
        [newData addObject:data];
        data.title = [[element firstChild] content];

        data.title = [data.title stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
    }

其中dataURL为http://www.gfchurch.com/ru/pages/video.php?a=5&b=51&c=37

如有需要,我可以提供更多信息。


你要解析的输入数据是什么? - ajay
DataURL。HTML页面链接在问题底部。 - maxned
为什么在iOS 6上HTML有效,但在iOS 7上无效? - maxned
1
@Mr.Russian HTML的有效性与您解析它的操作系统无关。无论如何,它都是无效的。也许Objective-C库或libxml2在iOS 6上比iOS 7更宽容(出于某种原因)。 - user529758
链接已失效。是HTML的问题吗?你解决了你的问题吗?你的问题与其他人类似,更多信息会很有用。 - David H
显示剩余2条评论
2个回答

1

这个问题的解决是不在 searchPathQuery 中使用 //。我应该再次测试这个问题,因为这个库一个月前已经更新,也许问题已经解决了。


-2

我通过正确管理命名空间,通过@xmlXPathRegisterNs@解决了这个问题。

我没有遇到解析HTML的问题,而是SOAP响应的问题。


1
你能否举个例子展示一下你是如何解决的?我是通过在searchPathQuery中不使用//来解决的。 - maxned

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接