我正在编写一个Python脚本,它将从网页解析后提取脚本位置。假设有两种情况:
<script type="text/javascript" src="http://example.com/something.js"></script>
和
<script>some JS</script>
我可以获取第二种情况下的JavaScript代码,也就是当JS代码直接写在<script>标签中时。
但是是否有办法可以获取第一种情况下(即提取<script>标签内所有src标签的值,如http://example.com/something.js)的src值呢?
以下是我的代码:
#!/usr/bin/python
import requests
from bs4 import BeautifulSoup
r = requests.get("http://rediff.com/")
data = r.text
soup = BeautifulSoup(data)
for n in soup.find_all('script'):
print n
输出: 一些JS