0人評分過此書
Hadoop+Spark+Python大数据处理从算法到实战
作者
:
出版日期
:
2021
閱讀格式
:
EPUB
ISBN
:
9787301321447
朗讀功能
:
因版權限制,本書不支援朗讀功能
擁有此書的圖書館
搜尋館別
選擇單位類型或單位所在地區
選擇單位類型
:
選擇單位所在地區
:
- The Hang Seng University of Hong Kong (香港恒生大學) 前往
- 中原大學 前往
- 中國文化大學 前往
- 中央研究院 前往
- 中山醫學大學暨附設醫院 前往
- 中華大學 前往
- 中華醫事科技大學 前往
- 亞洲大學 前往
- 佛光大學 前往
- 健行科技大學 前往
- 元培醫事科技大學 前往
- 元智大學 前往
- 南臺科技大學 前往
- 南華大學 前往
- 吳鳳科技大學 前往
- 國家圖書館 前往
- 國立中央大學 前往
- 國立中山大學 前往
- 國立中正大學 前往
- 國立中興大學 前往
- 國立勤益科技大學 前往
- 國立嘉義大學 前往
- 國立宜蘭大學 前往
- 國立屏東大學 前往
- 國立屏東科技大學 前往
- 國立成功大學 前往
- 國立政治大學 前往
- 國立東華大學 前往
- 國立東華大學-美崙校區 前往
- 國立清華大學 前往
- 國立清華大學_南大校區 前往
- 國立澎湖科技大學 前往
- 國立聯合大學 前往
- 國立臺中科技大學 前往
- 國立臺北大學 前往
- 國立臺北教育大學 前往
- 國立臺北科技大學 前往
- 國立臺北藝術大學 前往
- 國立臺北護理健康大學 前往
- 國立臺南大學 前往
- 國立臺東大學 前往
- 國立臺灣大學 前往
- 國立臺灣師範大學 前往
- 國立臺灣海洋大學 前往
- 國立臺灣科技大學 前往
- 國立虎尾科技大學 前往
- 國立陽明交通大學 前往
- 國立雲林科技大學 前往
- 國立高雄大學 前往
- 國立高雄餐旅大學 前往
- 國防醫學大學圖書館(含三總、北投、松山、澎湖) 前往
- 大仁科技大學 前往
- 大同大學 前往
- 大葉大學 前往
- 嶺南大學 Lingnan University 前往
- 弘光科技大學 前往
- 德明財經科技大學 前往
- 慈濟大學 前往
- 朝陽科技大學 前往
- 東吳大學 前往
- 東海大學 前往
- 樹德科技大學 前往
- 正修科技大學 前往
- 海軍軍官學校 前往
- 淡江大學 前往
- 玄奘大學 前往
- 真理大學 前往
- 聖方濟各大學 Saint Francis University 前往
- 聖約翰科技大學 前往
- 臺北城市科技大學 前往
- 臺北基督學院 前往
- 臺北市立大學 前往
- 臺南應用科技大學 前往
- 輔仁大學 前往
- 輔英科技大學 前往
- 逢甲大學 前往
- 銘傳大學 前往
- 長庚大學 前往
- 長榮大學 前往
- 靜宜大學 前往
- 香港中文大學 The Chinese University of Hong Kong 前往
- 香港城市大學 City University of Hong Kong 前往
- 香港大學圖書館 University of Hong Kong Libraries 前往
- 香港教育大學 The Education University of Hong Kong 前往
- 香港樹仁大學 Hong Kong Shue Yan University 前往
- 香港浸會大學 Hong Kong Baptist University 前往
- 香港珠海學院 Hong Kong Chu Hai College 前往
- 香港理工大學The Hong Kong Polytechnic University 前往
- 香港理工大學專業及持續教育學院 前往
- 香港科技大學 前往
- 香港都會大學 Hong Kong Metropolitan University 前往
- 高雄科技大學 前往
- 龍華科技大學 前往
2020年3月,国家提出要加快5G网络,数据中心等新型基础设施(简称新基建)进度。其中,信息化新型基础设施包含了云计算、大数据、人工智能、区块链、5G等内容。本书围绕新基建的云计算、机器学习及人工智能展开讲述大数据处理分析与实战应用,分为如下五个部分。第1部分:介绍了大数据的概念与特点,以及几个典型的产业应用场景。通过这些案例简介,期望读者能够了解大数据的前景,以及作为科技工作者肩负的使命。第2部分:介绍了目前云计算中的一个重要研究与应用领域----容器云。这一部分包含容器技术Docker与容器编排工具Kubernetes。Docker能封装操作系统、应用程序及其执行环境。对于整个大数据来说,Docker是Hadoop、Hbase、Spark这些组件的基础运行平台。一般大数据运行平台规模都比较宏大,因此这里使用了Kubernetes来对容器进行管理。这样,就构建了基于容器云的大数据平台。第3部分:是大数据分析的基础,也是大数据分析技术的重点。首先介绍了Hadoop的框架原理、调度原理、MapReduce原理与编程模型、环境搭建。由于Hadoop的HDFS存在一定的读写局限,因此引入了Hbase以支持实时读写。同样HDFS的数据也存在一定的分析局限,因此引入了Hive来构建数据仓库,以提高分析效率。在本篇最后,还引入了Spark这样的高性能框架,进一步提高了大数据处理能力。第4部分:是机器学习相关算法的应用篇。机器学习是一个复杂的过程,涉及到统计学、微积分、信息论等内容。考虑到学习门槛,在这一环节,首先简单介绍了相关算法的原理,然后介绍相对容易使用的机器学习工具Sklearn,使得读者建立起对机器学习开发流程的基本认知,之后介绍应用于大数据环境下Spark的机器学习库。相信通过对这一部分内容的学习,读者已经掌握了基本的机器学习问题的处理。第5部分:通过第一个实例介绍了如何使用Spark机器学习库中的协同过滤算法,来实现基于Web的推荐系统;通过第二个实例介绍了如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。
本书内容精练、重点突出、实例丰富,是广大数据分析工作者的参考书,同时也非常适合大、中专院校师生学习阅读,还可作为高等院校统计分析及相关专业的教材。
本书内容精练、重点突出、实例丰富,是广大数据分析工作者的参考书,同时也非常适合大、中专院校师生学习阅读,还可作为高等院校统计分析及相关专业的教材。
- 出版地 : 中國大陸
- 語言 : 簡體中文
按鈕
(最多能選 20 間)
執行篩選