以下是我使用的代码(它不仅处理ASCII标签还能处理UTF-8标签): private static final Pattern TAG_PATTERN = Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)"); 顺便说一下,你应该可以从推文实体中获取标签(include_entities=true)
\p{L}
。 - Bozho