专栏/大数据分析实战[教程]

大数据分析实战[教程]

2021年10月09日 08:53--浏览 · --点赞 · --评论
粉丝:1279文章:2

引言

关于这个系列教程的由来,还是因为几年前随着大数据技术和应用越来越热门,老土的很多学生对大数据技术越来越感兴趣,也都利用自己的业余时间自学相关内容。同时,产业对引入大数据技术解决自身问题的需求也越来越强烈,相关项目机会也越来越多。于是老土觉得有必要开始着手整理一份大数据学习教程帮助学生快速的上手相关项目。

由于老土进到大数据这个行当并不算最早的一批啊,所以当老土准备弄这个教程的时候,网上已经有很多“大数据实战教程”、“大数据从入门到精通”之类的教程,同时类似名称的书也不少。但在老土对这类教程调研了一圈后,觉得都不是很满意,主要的原因是觉得

“现有教程设计的上手路径或是太长,或是太短”

具体来说,这些教程往往会更加关注内容的体系性和完备性。比如有很多教程和书籍就会从一个完整的大数据平台和大数据应用的角度展开内容,对数据清洗、数据存储、数据分析的相关技术和相关软件等做全面的介绍;也有一些教程和书籍则是从某种编程语言(如:Python)的角度开展内容,从编程语言的基础一直讲到语言的高阶应用。这种组织教程的方式似乎并没有问题,实际上国内绝大多数计算机专业学生学习相关技术的方式也类似,非常强调学习内容的系统化和完备性。但从“实战教程”的角度讲,老土对这种大而全的教学内容组织方式是有些想法的。作为一名计算机专业的教师,老土见到了大量的计算机专业学生已经学了几周,甚至几个月的编程语言,但竟然连一个最简单的应用也写不出来。这不但导致了学生的实战能力不足,更大的隐患在于由于迟迟得不到成就感,这极大降低了学生的学习积极性。同时由于学习到的很多技术内容在短期内不会用到,学生往往会迅速遗忘,导致事实上浪费了很多学习精力。

然而很搞笑的是,有很多社会上的培训机构往往打着7天学会开发搜索引擎、2天开发人脸识别应用的营销广告…什么会出现这种情况呢?当然一部分原因是这些培训机构的广告是有夸张成分的,但从另一个角度讲,这些培训机构组织教学内容的方式也与学科教育中的教学内容组织方式有很大区别。这些培训机构往往上来就直接将源代码交给学生,让学生能够快速的运行起来,而后对其中的某几个可定制的点做简单介绍,从而让学生迅速的上手,并感觉可以自主实现相关应用。这种方式的问题主要在于,这种纯粹面向具体应用的教学对于提升学员应用能力的效果并不好,一旦需要对应用做较为深入的定制或是开发其他应用,那这些学员往往无法完成相关工作。

综上,老土希望可以设计一套兼顾“尽快上手”和“能力提升”的教程 。具体的思路是:

  1. 教程中各讲的内容尽可能自包含和可复现。“自包含“指的是尽可能减少本节内容对其他内容的依赖。“可复现“指的是在教程中不但会提供完备的可参考的源代码,而且教程中会对源代码进行详细的介绍,降低学员上手难度;

  2. 教程整体脉络可视化和路径化。通过提供“地图”对教程中各讲内容之间关系加以说明,对教程涉及到的和没有涉及到的内容加以说明,为学员提供一章地图,让学生实时知道自己在什么地方,以及周边还有哪些“风景”,同时在“地图”中还要标明“推荐游览的路径”,为不同类型的学员推荐相关内容的学习次序,从而兼顾内容的完备性和学习的目标性。

  3. 教程持续更新。技术领域最大的特征就是新技术的持续演进,教程自然需要持续更新。

教程地图(内容安排)

”大数据分析实战“教程地图如下所示。

注意:

1)图中“橙色线框”的内容是针对全新小白学员推荐的最开始的七部分内容,如下:

  1. 搭建开发环境

  2. Python基础应用(网络爬虫)

  3. Python基础应用(数据可视化)

  4. 逻辑回归

  5. 决策树

  6. 第一个神经网络

  7. 卷积神经网络

2)图中“虚线框”为将在近期提供的内容。

3)图中蓝色的链接均可以点击,将直接打开相关教学内容的页面。

4)因为B站的编辑器无法嵌入iframe,所以不能直接插入可交互的地图。大家可以直接访问链接:https://www.processon.com/view/link/616146c15653bb1336d06b98



投诉或建议