国外课栈 - 国外电子信息技术视频教程、电子书和博文栈
数据科学和机器学习系列:使用Python Scrapy,Selenium和MySQL进行高级数据采集
数据科学和机器学习系列:使用Python Scrapy,Selenium和MySQL进行高级数据采集
类别 : 视频教程
格式 : MP4
订阅须知  订阅
概述

数据科学和机器学习系列:使用Python Scrapy,Selenium和MySQL进行高级数据采集

在数据科学和机器学习系列的第三部分中,将Python Scrapy应用于高级数据采集项目。通过讲座和动手操作相结合,与机器学习专家Advait Jayant一起学习使用Python构建的强大Web爬网框架。

本数据科学和机器学习课程将涵盖以下三个主题:

  • 抓取在线书店的一部分1。在数据科学和机器学习系列的第一个主题中,使用Scrapy构建网络爬虫从在线书店获取文本。Scrapy是一个用Python编写的开源Web爬网框架,用于从网站中提取所需的数据。它基于Twisted(一个异步网络框架)构建。
  • 抓取在线书店第2部分。在“数据科学和机器学习系列”的第二个主题中,继续使用Scrapy从在线书店中抓取数据。利用Selenium工具为Web应用程序编写自动化测试。使用网络搜寻器将数据导出为json,csv和其他文件格式。
  • 抓取在线书店第3部分。在数据科学和机器学习系列的第三个主题中,将使用我们在前两个会话中构建的Web爬网程序获得的数据导出到MySQL数据库中。

时长:2时

Data Science,Machine Learning,Data Acquisition,Python