Dart提取URL字符串中的主机名

Question

11

假设我有以下字符串作为URL：

String urlSource = 'https://www.wikipedia.org/';

我想从这个URL字符串中提取主页名称:'维基百科'，删除URL中的'https://'、'www'、'.com'和'.org'部分。

最佳提取方法是什么？如果使用RegExp，则需要使用什么正则表达式？

- SLendeR

3

“wikipedia”不是页面名称，而是二级域名。无论如何，[^\.]+(?=\.[^\.]+$)可以使用。 - MonkeyZeus

如下所述，最好使用现有的代码来处理解析。两个教训：1）并非涉及字符串的每个问题都需要正则表达式，2）如果这个问题是其他人可能遇到的问题，那么寻找现有的代码来为您完成它。 - Andy Lester

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- creativecreatorormaybenot · Accepted Answer

在这种情况下，您不需要使用RegExp。

Dart已经为解析URL提供了预制的类：

`Uri`

使用该API实现您想要的功能非常简单：

final urlSource = 'https://www.wikipedia.org/';

final uri = Uri.parse(urlSource);
uri.host; // www.wikipedia.org

Uri.host 属性会给出 www.wikipedia.org。从中，您应该能够轻松提取出 wikipedia。

Uri.host 还将删除整个路径，即主机后的任何内容在/之后。

如果您想从主机中获取二级域名，例如 wikipedia，您可以使用 uri.host.split('.')[uri.host.split('.').length - 2]。

但是请注意，这不是万无一失的，因为您可能有子域或没有（例如www），顶级域也可能由多个部分组成。例如，co.uk 使用 co 作为二级域名。