書籍分類

商管‧財經 (13829)

多媒體電子書 (1625)

文學‧小說 (22499)

設計‧藝術 (4617)

生活 (13855)

圖文‧漫畫 (2637)

科普 (3342)

人文 (17997)

社科 (15354)

親子‧童書 (6614)

語言 (5018)

電腦 (2753)

考用‧參考書 (4682)

理工農醫 (8673)

學術書 (37051)

政府出版品 (254)

單位自行出版品 (19)

瀏覽過的書籍

首頁
>
書籍詳目頁

購買書籍

0　人評分過此書

Hadoop+Spark+Python大数据处理从算法到实战

作者：朱春旭 (著)
學科分類：科學類
書籍分類：資訊總論 ; 程式語言 ; 電機資訊學院
出版社：北京大学出版社有限公司
出版地：中國大陸
出版日期：2021
語文：簡體中文
ISBN/識別號：9787301321447

可使用：0人

線上閱讀中：0人

下載閱讀中：0人

借閱天數：0天

推薦採購不提供QR CODE

線上閱讀

本書提供兩種檔案格式，請選擇開啟：

EPUB彈性排版，可依載具大小自動斷行或換頁，較適合小螢幕閱讀。

書籍內容
國際計量
同類型書籍推薦

書籍內容

TOP

內容簡介
目錄

2020年3月，国家提出要加快5G网络，数据中心等新型基础设施（简称新基建）进度。其中，信息化新型基础设施包含了云计算、大数据、人工智能、区块链、5G等内容。本书围绕新基建的云计算、机器学习及人工智能展开讲述大数据处理分析与实战应用，分为如下五个部分。第1部分：介绍了大数据的概念与特点，以及几个典型的产业应用场景。通过这些案例简介，期望读者能够了解大数据的前景，以及作为科技工作者肩负的使命。第2部分：介绍了目前云计算中的一个重要研究与应用领域----容器云。这一部分包含容器技术Docker与容器编排工具Kubernetes。Docker能封装操作系统、应用程序及其执行环境。对于整个大数据来说，Docker是Hadoop、Hbase、Spark这些组件的基础运行平台。一般大数据运行平台规模都比较宏大，因此这里使用了Kubernetes来对容器进行管理。这样，就构建了基于容器云的大数据平台。第3部分：是大数据分析的基础，也是大数据分析技术的重点。首先介绍了Hadoop的框架原理、调度原理、MapReduce原理与编程模型、环境搭建。由于Hadoop的HDFS存在一定的读写局限，因此引入了Hbase以支持实时读写。同样HDFS的数据也存在一定的分析局限，因此引入了Hive来构建数据仓库，以提高分析效率。在本篇最后，还引入了Spark这样的高性能框架，进一步提高了大数据处理能力。第4部分：是机器学习相关算法的应用篇。机器学习是一个复杂的过程，涉及到统计学、微积分、信息论等内容。考虑到学习门槛，在这一环节，首先简单介绍了相关算法的原理，然后介绍相对容易使用的机器学习工具Sklearn，使得读者建立起对机器学习开发流程的基本认知，之后介绍应用于大数据环境下Spark的机器学习库。相信通过对这一部分内容的学习，读者已经掌握了基本的机器学习问题的处理。第5部分：通过第一个实例介绍了如何使用Spark机器学习库中的协同过滤算法，来实现基于Web的推荐系统；通过第二个实例介绍了如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。本书内容精练、重点突出、实例丰富，是广大数据分析工作者的参考书，同时也非常适合大、中专院校师生学习阅读，还可作为高等院校统计分析及相关专业的教材。

國際計量

TOP

Hadoop+Spark+Python大数据处理从算法到实战

*若沒有可用的測量指標，代表資料尚在更新，近期將上線。

同類型書籍推薦

TOP

書籍分類

瀏覽過的書籍

Hadoop+Spark+Python大数据处理从算法到实战

書籍內容

國際計量

同類型書籍推薦

多雲環境下，國際雲端大廠跨雲佈局分析

MATLAB程式設計：基礎篇

2015 ICT產業白皮書（下）：顯示∕軟體服務

從人工智慧產業應用看AI晶片發展

借閱資訊

書籍分類

瀏覽過的書籍

Hadoop+Spark+Python大数据处理从算法到实战

書籍內容

國際計量

同類型書籍推薦

多雲環境下，國際雲端大廠跨雲佈局分析

MATLAB程式設計：基礎篇

2015 ICT產業白皮書（下）：顯示∕軟體服務

從人工智慧產業應用看AI晶片發展

預約書籍