我有一个网络应用程序,正在开发一个引擎来分析推荐来源。
现在我有一个包含页面浏览量和参考来源的表格,看起来像这样:
pv_id referer
------------------------------------------------------------
5531854534 http://www.google.com/search?ie=UTF-8...
8161876343 http://google.cn/search?search=human+rights
8468434831 http://search.yahoo.com/search;_...
第二个表格包含源定义,例如:
source regex
------------------------------------------------------------
Google ^https?:\/\/[^\/]*google\.([a-z]{2,4})(\/.*)?$
Yahoo ^https?:\/\/[^\/]*yahoo\.com(\/.*)?$
我想要的是通过连接这两个表创建的第三张表:
pv_id source
------------------------------------------------------------
5531854534 Google
8161876343 Google
8468434831 Yahoo
如何使用正则表达式连接这些表格?
更新:
将正则表达式的最后一部分从
(\/.*|)
更改为 (\/.*)?
。
/something
(即\/.*
部分),要么为空(管道符之后没有任何内容:) 这些正则表达式在正则表达式编辑器中有效。但我将尝试不使用管道符。 - Josef Sábl(\/.*)?
,现在它可以工作了,谢谢! - Josef Sábl