从URL中提取子字符串的正则表达式

Question

从URL中提取子字符串的正则表达式

3

我需要从URL中检索一些单词：

WebViewActivity - https://google.com/search/?term=iphone_5s&amp;utm_source=google&amp;utm_campaign=search_bar&amp;utm_content=search_submit

return I want :

search/iphone_5s

但我卡住了，不太明白如何使用regexp_substr来获取那个数据。

我正在尝试使用这个查询：

regexp_substr(web_url, '\google.com/([^}]+)\/', 1,1,null,1)

仅返回“search”单词，并且当我尝试时

regexp_substr(web_url, '\google.com/([^}]+)\&', 1,1,null,1)

原来我获取的所有单词都是直到最后一个'&'为止。

- Dede Soetopo

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Wiktor Stribiżew · Accepted Answer

您可以使用 REGEXP_REPLACE 正则表达式进行匹配整个字符串但捕获两个子字符串并替换为两个反向引用以捕获组值：

REGEXP_REPLACE(
    'WebViewActivity - https://google.com/search/?term=iphone_5s&amp;utm_source=google&amp;utm_campaign=search_bar&amp;utm_content=search_submit',
    '.*//google\.com/([^/]+/).*[?&]term=([^&]+).*',
    '\1\2')

请查看正则表达式演示和在线Oracle演示。 模式详情

.* - 匹配除换行符以外的任意零个或多个字符，尽可能多地匹配
//google\.com/ - 匹配//google.com/子字符串
([^/]+/) - 捕获组1: 一个或多个非 / 字符，然后是一个 /
.* - 匹配除换行符以外的任意零个或多个字符，尽可能多地匹配
[?&]term= - ? 或 & 和一个term=子字符串
([^&]+) - 捕获组2: 一个或多个非 & 字符
.* - 匹配除换行符以外的任意零个或多个字符，尽可能多地匹配

注意: 若要使用此方法并在未找到匹配项时获取空结果，请在正则表达式模式末尾添加|.+。