博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python-urllib2、beautifulsoup4模块使用_已迁移
阅读量:6356 次
发布时间:2019-06-23

本文共 366 字,大约阅读时间需要 1 分钟。

  hot3.png

关键字用下划线

import urllib2  

response = urllib2.urlopen('  #获取URL

print response.getcode()        #获取返回状态码

response.add_header('user-agent', 'Mozilla/5.0')  #模拟火孤请求

pip install beautifulsoup4 #安装网页解析器

#获取页面的编码

import urllib2from bs4 import BeautifulSouphtml = urllib2.urlopen('  soup = BeautifulSoup(html)>>> soup.original_encodingu'gbk'

转载于:https://my.oschina.net/Majw/blog/552491

你可能感兴趣的文章
Object-C中emoji与json的问题
查看>>
linux 命令
查看>>
灾后重建
查看>>
Nothing 和 Is
查看>>
第一个sprint冲刺第三天
查看>>
周末web前端练习
查看>>
hdu 5754 Life Winner Bo 博弈论
查看>>
Overlay network 覆盖网络
查看>>
Linux之编译需要的文件变化时刻
查看>>
IntelliJ IDEA中怎么查看方法说明?
查看>>
mvn常用命令
查看>>
redis zset 顺序问题
查看>>
C# 判断网站是不是discuz论坛
查看>>
[转载] 七龙珠第一部——第001话 布玛与孙悟空
查看>>
linux 内核升级
查看>>
BZOJ1791[Ioi2008]Island 岛屿 ——基环森林直径和+单调队列优化DP+树形DP
查看>>
文件共享及dup函数
查看>>
jQurey动态添加/删除DIV(原创自Zjmainstay)
查看>>
Android流量统计TrafficStats类的使用
查看>>
View实现涂鸦、撤销以及重做功能【转】
查看>>