Python爬虫利器之Beautiful Soup的用法,以及实例!

news/2024/7/8 0:42:21

可以利用 pip 来安装:

pip install beautifulsoup4

源代码:

import requests
r = requests.get("https://python123.io/ws/demo.html")
r.text
demo = r.text
from bs4 import BeautifulSoup
soup = BeautifulSoup(demo , "html.parser")
print(soup.prettify())

原网页,右键查看源代码:
在这里插入图片描述
利用爬虫执行之后:
在这里插入图片描述
可以看到树形的代码结构!

技术参考文档:https://cuiqingcai.com/1319.html


http://lihuaxi.xjx100.cn/news/267069.html

相关文章

图像处理之三种常见双立方插值算法

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达详解几种常见的双立方插值技术!好东西记得分享图像插值技术概述图像插值技术在图像几何变换、透视变换等过程中是必不可少的技术环节,可以说像素插…

CTO说:Service层的接口是不是多此一举

点击上方蓝色“方志朋”,选择“设为星标”回复“666”获取独家整理的学习资料!作者:架构思维来源:toutiao.com/i6882356844245975563今天我们要探讨的问题是:Service层需要接口?现在结合我参与的项目以及阅…

安装docker后遇到permision问题

通过将用户添加到docker用户组可以将sudo去掉,命令如下 sudo groupadd docker #添加docker用户组 sudo gpasswd -a $USER docker #将登陆用户加入到docker用户组中 newgrp docker #更新用户组

神经网络的介绍

1. 人工神经网络的概念 人工神经网络(英语:Artificial Neural Network,ANN),简称神经网络(Neural Network,NN)或类神经网络,是一种模仿生物神经网络(动物的中…

web service 项目 和 普通 web项目 的 区别

web service 面向的是开发者(需要再次开发) 普通web 面向的是用户(直接使用)转载于:https://www.cnblogs.com/zno2/p/5612024.html

自监督学习新思路!基于蒸馏损失的自监督学习算法 | CVPR 2021

点击上方“视学算法”,选择加"星标"或“置顶”重磅干货,第一时间送达AI 科技评论报道编辑 | 陈大鑫AI 科技评论 今天给大家介绍一篇被 CVPR 2021 收录的关于自监督的文章——S2-BNN [1],论文作者来自 CMU,HKUST 和 IIAI…

PHP 遍历文件

一:使用scandir 函数 1.1 函数封装 scandir : 是php 自带函数,返回当前目录下的所有文件和文件夹。注意:会有 ‘.’ 和’..’,分别代编当前目录和上层目录。 /*** 使用scandir 遍历目录** param $path* return array*/ function getDir($path) {//判断目…

EntityFramework Core 学习笔记 —— 创建模型

原文地址:https://docs.efproject.net/en/latest/modeling/index.html 前言: EntityFramework 使用一系列的约定来从我们的实体类细节创建模型。我们可以钦定一些额外的映射配置来添加、重写实体类的哪些细节应该被这些约定所发现。 这篇文章讲述了一些无…