
会员
Python网络爬虫技术与实践
教材教辅研究生/本科/专科教材11.3万字
更新时间:2023-11-10 18:05:04 最新章节:内容简介
书籍简介
本书介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍了Python爬虫程序开发的各个方面,包括HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等不同领域的内容。全书共14章,分为基础篇、进阶篇、提高篇和实战篇四个部分,内容覆盖网络抓取与爬虫编程中的主要知识和技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示了编写爬虫程序的核心流程。本书适合Python语言初学者、网络爬虫技术爱好者、数据分析从业人员以及高等院校计算机科学、软件工程等相关专业的师生阅读。
品牌:机械工业出版社
上架时间:2023-06-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔 张扬 杨壮等编著
最新上架
- 会员随着计算机技术的持续突破,人工智能生成内容(AIGC)应运而生,显示出其在内容创作领域的巨大潜力。本书深入浅出地探讨了AIGC的理论基础、实践应用与发展前瞻,是技术与创新并重的专业指南。本书主要内容包括AIGC概述、AIGC工具与应用,重点介绍了写作类、图表类、演示文稿类、图像类、音乐类及视频类AIGC工具的实操技巧,旨在为读者提供一条清晰的学习与应用路径。本书内容前沿,案例翔实,不仅适合作为高等教材教辅9.4万字
- 会员本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、教材教辅9.7万字
- 会员本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验教材教辅8万字
同类书籍最近更新
- 会员本书全面、系统地介绍新媒体技术的核心知识与应用领域,包括新媒体技术概述、图形图像的编辑与制作、视频的编辑与制作、音频的编辑与制作、动画的编辑与制作及综合案例等内容。本书第1章为基础知识;第2~5章以课堂案例为主线展开讲解,每个课堂案例都有详细的操作步骤,学生通过实际操作可以快速熟悉新媒体技术并掌握应用技巧,课堂练习和课后习题可以提升学生应用新媒体技术的能力,拓展学生的设计思路;第6章综合案例设有8高教教材9万字