网页下载器。
requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库。requests自称“HTTP for Humans”,经过高度封装,提供的api非常方便。
pip install requests
import requests
网页解析器,简写为bs4。相比于传统正则表达方式去解析网页源代码,bs4要简单得多。
简单来说,这是Python的一个HTML或XML的解析库,可以用它方便地从网页中提取数据。
pip install beautifulsoup4
pip install lxml
from bs4 import BeautifulSoup
搞定动态加载网站。
Selenium 是最广泛使用的开源 Web UI(用户界面)自动化测试套件之一。Selenium 支持的语言包括C#,Java,Perl,PHP,Python 和 Ruby。目前,Selenium Web 驱动程序最受 Python 和 C#欢迎。 Selenium 测试脚本可以使用任何支持的编程语言进行编码,并且可以直接在大多数现代 Web 浏览器中运行。在爬虫领域 selenium 同样是一把利器,能够解决大部分的网页的反爬问题。
pip install selenium
import selenium
Pandas是基于Numpy的专业数据分析工具, 可以灵活高效的处理各种数据集。它提供了的数据结构有DataFrame和Series等,可以简单的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列
pip install pandas
import pandas as pd
NumPy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。 NumPy包的核心是 ndarray 对象。它封装了python原生的同数据类型的 n 维数组,为了保证其性能优良,其中有许多操作都是代码在本地进行编译后执行的。
pip install numpy
import numpy as np
import jieba.analyse as analyse
import jieba
from gensim import corpora, models, similarities
import gensim
这是一个WIFI库。pywifi模块基于comtypes模块。
pywifi是在python中一个用于操作无线接口的模块,可以跨平台使用,Windows和Linux都支持。
pip install pywifi
pip install comtypes
import pywifi
from pywifi import const
import RPi.GPIO as GPIO
------ 2023-10-14日之前 ------
PyQt是Python语言的GUI(Graphical User Interface,简称 GUI,又称图形用户接口)编程解决方案之一。可以用来代替Python内置的Tkinter。其它替代者还有PyGTK、wxPython等,与Qt一样,PyQt是一个自由软件。
pip install PyQt5
from PyQt5 import QtCore, QtGui, QtWidgets
Matplotlib 是一个非常强大的 Python 绘图库,我们可以使用它将很多数据通过各种静态、动态、交互式图表的形式直观的呈现出来,比如:线图、散点图、条形图、饼图、3D 图形、图形动画等等,并且提供多样化的输出格式。Matplotlib 通常与 NumPy 和 Pandas 等库一起使用, 形成一个强大的科学计算环境,有助于我们通过 Python 学习数据科学、机器学习。
需要注意的是,matplotlib 的依赖库包括 numpy、cycler、Pillow、packaging、pyparsing、python-dateutil、fonttools、contourpy、kiwisolver,需要预先安装,不过只要连网后都会自动下载安装。
pip install matplotlib
import matplotlib as mp
import matplotlib.pyplot as plt
pyecharts库是一个用于生成 Echarts 图表的类库。
Echarts是一个由百度开源的商业级数据图表,它是一个纯JavaScript的图表库,可以为用户提供直观生动,可交互,可高度个性化定制的数据可视化图表,赋予了用户对数据进行挖掘整合的能力。
pip install pyecharts
from pyecharts.charts import Line
from pyecharts.charts import Map
from pyecharts.charts import Bar, Timeline
from pyecharts.options import TitleOpts, LegendOpts
------ 2023-10-17 星期二 20:23:13 ------
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学库NumPy和SciPy联合使用。
pip install scikit-learn
import sklearn
from sklearn import svm
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn import datasets
------ 2023-11-19 星期日 20:23:13 ------
PyTorch是一个由Facebook的人工智能研究团队开发的开源深度学习框架。在2016年发布后,PyTorch很快就因其易用性、灵活性和强大的功能而在科研社区中广受欢迎。
https://pytorch.org/get-started/locally/
torch torchvision torchaudio
import torch
from torch import nn, optim
from torch.utils.data import Dataset, DataLoader
import torchvision.transforms as transforms
from torch.optim.optimizer import Optimizer
------ 2024-05-31 星期五 17:44:14 ------