如何从电子邮件正文解析HTML-Python

Python 6年前 35

+-

如何从电子邮件正文解析HTML-Python

我正在尝试解析 python中的传入电子邮件.
我收到的电子邮件是部分HTML文本.
我想获取HTML部分并在HTML中找到一个表.

我尝试使用beatifulsoup.但是当尝试下一个代码时,bs仅获得第一个“”部分,而不是所有HTML部分：

# connecting to the gmail imap server
m = imaplib.IMAP4_SSL("imap.gmail.com")
m.login(user,pwd)
# use m.list() to get all the mailboxes, "INBOX" to get only inbox
m.select("INBOX")
resp, items = m.search(None, '(UNSEEN)') # you could filter using the IMAP rules here (check http://www.example-code.com/csharp/imap-search-critera.asp)
items = items[0].split() # getting the mails id

for emailid in items:
    # getting the mail content
    resp, data = m.fetch(emailid, '(UID BODY[TEXT])')
    text = str(data[0][1])
    soup = bs(text)

如何在整个HTML部分中使用“ bs”？
或者,还有其他方法可以从电子邮件正文中解析出html表吗？

‘bs’似乎对我来说是最好的,因为我想找到一个包含特定关键字的特定HTML正文,并且’bs’搜索可以检索整个表并让我对其进行迭代.

最佳答案

显然,我使用了错误的解析器.

一旦更改为“ lxml”解析器,它就可以正常工作.

需要更改下一行：

soup = bs(text,"lxml");

点击查看更多相关文章

转载注明原文：如何从电子邮件正文解析HTML-Python - 乐贴网

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208046

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

每日神器 4年前 5658

DIYP影音内置EPG版：导入直播源即可！畅享VIP电视直播、影视点播

DIYP影音内置EPG版：导入直播源即可！畅享VIP电视直播、影视点播

每日神器 5年前 17293

ZYPlayer285电脑版：全网影视资源聚合搜索+播放（附福利源导入教程）

ZYPlayer285电脑版：全网影视资源聚合搜索+播放（附福利源导入教程）

每日神器 4年前 3187

TVbox看片解除阿里云盘限速秒招：亲测有效！4K播放不卡顿~

TVbox看片解除阿里云盘限速秒招：亲测有效！4K播放不卡顿~

每日神器 3年前 6504

如何从hive中的特定桶数据中查询数据？

如何从hive中的特定桶数据中查询数据？

程序员 5年前 41

ZYPlayer276电脑版：全网影视资源聚合搜索+播放（附福利源导入教程）

ZYPlayer276电脑版：全网影视资源聚合搜索+播放（附福利源导入教程）

每日神器 5年前 5867

星火直播2013版：支持看5000个频道，还能看特色频道（电视版+手机版）

星火直播2013版：支持看5000个频道，还能看特色频道（电视版+手机版）

每日神器 5年前 65

啃不动 React 源码，是不是不适合做前端开发？

啃不动 React 源码，是不是不适合做前端开发？

便宜主机 5年前 123

java-使用服务器游标获取与流式获取之间的区别

java-使用服务器游标获取与流式获取之间的区别

JAVA 6年前 29

VUE，Ant Design Vue,怎么解决table表格中分页1000条数据，下滑卡顿以及全选问题

VUE，Ant Design Vue,怎么解决table表格中分页1000条数据，下滑卡顿以及全选问题

vue.js 5年前 36

pytorch中的损失函数总结——分类和分割相关

pytorch中的损失函数总结——分类和分割相关

神经网络 5年前 220

python – 填充matplotlib中的两条垂直线

python – 填充matplotlib中的两条垂直线

Python 6年前 159

python-Sqlite executemany和DELETE

python-Sqlite executemany和DELETE

Python 6年前 32

如何使用PIL / Pillow读取zip文件中的图像

如何使用PIL / Pillow读取zip文件中的图像

Python 6年前 36

如何使用OpenMP编译OpenCV

如何使用OpenMP编译OpenCV

Python 6年前 22

如何使用d.items()更改for循环中的所有字典键？

如何使用d.items()更改for循环中的所有字典键？

Python 6年前 28

如何在Airflow中运行bash脚本文件

如何在Airflow中运行bash脚本文件

Python 6年前 690

Python中2种稀疏矩阵的逐行乘法的特殊类型

Python中2种稀疏矩阵的逐行乘法的特殊类型

Python 6年前 67

python – Networkx Multigraph from_pandas_dataframe

python – Networkx Multigraph from_pandas_dataframe

Python 6年前 101

Python ImportError：没有名为资源的模块

Python ImportError：没有名为资源的模块

Python 6年前 24

python – pandas从csv文件中读取MultiIndex数据

python – pandas从csv文件中读取MultiIndex数据

Python 6年前 63

Python：为什么它不接受01或02或03的输入？

Python：为什么它不接受01或02或03的输入？

Python 6年前 32

python – 如何将数据集拆分为类之间的训练和验证集保持比率？

python – 如何将数据集拆分为类之间的训练和验证集保持比率？

Python 6年前 62