Python共41篇 第4页
如何将Python写的代码打包成.exe可执行文件 - 拽熊博客

如何将Python写的代码打包成.exe可执行文件

pyinstaller打包机制 我们写的python脚本是不能脱离python解释器单独运行的,所以在打包的时候,至少会将python解释器和脚本一起打包,同样,为了打包的exe能正常运行,会把我们所有安装的第三...
Python爬虫教程六:多线程爬虫案例实例 - 拽熊博客

Python爬虫教程六:多线程爬虫案例实例

一、python多线程 关于多线程的知识,看下面这篇文章即可。 二、多线程实例 这里我们是把本站python爬虫教程四中的爬虫例子,给改编写成使用多线程的模式的。 原代码效果如下: import os impor...
python多线程超级详细! - 拽熊博客

python多线程超级详细!

一、什么是多线程? 多线程类似于同时执行多个不同程序,多线程运行有如下优点: 使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,比如用户点击了一个按钮去触...
Python爬虫教程五:数据清洗 - BeautifulSoup模块 - 拽熊博客

Python爬虫教程五:数据清洗 – BeautifulSoup模块

和lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据 区别在于:BeautifulSoup4可以使用CSS 选择器,lxml使用xpath 一、安装 安装 Beautiful S...
Python爬虫教程四:数据清洗-xpath表达式 - 拽熊博客

Python爬虫教程四:数据清洗-xpath表达式

xpath表达式:我们可以先将 HTML文件转换成 XML文档,然后用 XPath 查找 HTML 节点或元素。我们需要安装lxml模块来支持xpath的操作。 from lxml import etree 一、转换特定html对象 方法一:etr...
Python爬虫教程三:数据清洗-正则表达式 - 拽熊博客

Python爬虫教程三:数据清洗-正则表达式

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 python 中封装了re模块。 常用方法 re.match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置...
Python爬虫教程二:requests库数据挖掘 - 拽熊博客

Python爬虫教程二:requests库数据挖掘

什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Request...
Python爬虫教程一:urllib库数据挖掘 - 拽熊博客

Python爬虫教程一:urllib库数据挖掘

一、什么是Urllib Urllib是python内置的HTTP请求库,包括以下模块 二、request模块 1.urlopen方法 用于直接打开网址。 import urllib.request response = urllib.request.urlopen('http://www.b...