原文:
www.kdnuggets.com/2018/11/intro-data-science-managers.html
由 ActiveWizards 提供
1. Google 网络安全证书 - 快速开启网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你组织的 IT
数据科学已经成为许多现代项目和业务的不可或缺的一部分,越来越多的决策现在依赖于数据分析。数据科学行业正经历严重的 人才短缺,不仅是数据科学家,还有一些了解分析和数据科学的管理者。作为一名经理,你最终可以成为公司数据使用的专家,为组织的发展创造机会。无论你是与数据科学团队合作,作为数据驱动业务的一部分,还是对实施数据科学解决方案感兴趣,你都应具备一定的数据知识,并理解其在组织中的能力。
数据科学是一个极其广泛且复杂的学科,涵盖了计算机科学、数学和统计学,并且是一个需要理解数据来源的知识领域:医疗、金融、网络及其他领域。
以下思维导图包含了对关键数据科学概念和技术的简明介绍,这些概念和技术已经彻底改变了商业格局,并且成为了做出有益数据驱动决策的必要条件。我们相信,这将对数据科学管理者以及面临这一快速发展领域的客户或用户都非常有用且信息丰富。
原始思维导图可以在 这里 找到。
让我们更详细地了解一下。我们思维导图的分支按照特定方式分组。在中心,有两个基础知识部分,任何数据科学项目都是基于这两个部分建立的,即数学和统计学以及编程语言。
既然我们谈论的是基于数据的科学,很明显这里的基本知识之一是数学。机器学习中的每一个算法都是基于数学原理的,理解线性代数、概率论和经典统计学的基础是必要的。
向前看,所有那些巨大的计算和不同算法的实现以及数据科学任务的解决,都是通过各种编程语言实现的。作为经理,你不需要知道如何编写算法或理解每种语言的所有细节,但你必须理解哪些语言可以实现特定任务,它们的适用性,以及它们的优缺点。
思维导图的整个右侧直接与数据科学领域相关。这是一个广泛的概念,结合了三个非常大的领域:机器人技术、机器学习和强化学习,并进一步细分这些领域。此时经理的主要任务是了解机器学习的一般算法,它们可以应用于哪些行业,以及它们可以解决哪些用例。
思维导图的左侧涵盖了数据科学的支持领域:数据存储、数据工程、大数据、数据分析、可视化和商业智能(BI)。它们有助于清理、处理、转换和表示数据,并从不同角度分析数据,从而补充不同的机器学习任务。
数据科学依赖于创建和使用数据,这些数据必须在需要时随时可用。这正是数据存储的目的。数据存储是一种以方便的形式归档数据的技术。你应该了解 SQL 和 NoSQL 数据库之间的基本区别,为什么需要云服务,哪些服务提供了更方便和易于理解的界面,你为特定任务需要什么以及其他细节。
数据工程的主要目的是将数据转换为易于分析的格式。任何数据操作都需要对数据进行一些预处理,而数据的质量转换和处理在项目的成功中往往扮演着关键角色。大致来说,数据工程的主要操作包括数据抓取、数据摄取和数据清洗。
此外,在处理数据科学任务时,您经常需要处理传统数据处理工具和仪器无法处理的大量数据集。这时,大数据解决方案就显得尤为重要。除了处理大量数据外,大数据还有一些其他特定特征,即能够处理快速到达并不断增加的数据量,以及能够并行处理结构化和非结构化数据的能力。
数据分析是获取数据集信息并发现特定见解的过程。它旨在寻找输入参数之间的各种依赖关系。数据分析是公司营销、财务、业务管理等领域的一个不可或缺的部分。
最后,数据需要理解、解释和说明。每个与数据打交道的人都认识到BI和可视化工具在展示代码隐藏信息和使其可见方面的重要性。每个人对视觉信息的感知更好且更快,因此它是每个分析和数据科学项目的一个重要组成部分。对客户和开发者都有好处,它绝对应该在数据经理的工具箱中。
结论
当然,每个分支可以进一步扩展和细分,这不是终极真理,而是我们尝试展示的视角,反映了数据科学发展的现状。
数据科学是一个复杂而广泛的领域,因此无法突出单一最重要的分支。但现在,您应该对现代数据科学领域的主要组成部分及其相互关系有了大致的了解,这将是扩展您在该领域知识的一个良好开端。
如果您对这个话题有额外的想法和意见,请在下面的评论区分享。
另外,如果您有一些特定领域希望更详细地覆盖,请告知我们。
ActiveWizards 是一个专注于数据项目(大数据、数据科学、机器学习、数据可视化)的数据科学家和工程师团队。核心专业领域包括数据科学(研究、机器学习算法、可视化和工程)、数据可视化(d3.js、Tableau 等)、大数据工程(Hadoop、Spark、Kafka、Cassandra、HBase、MongoDB 等)以及数据密集型 Web 应用开发(RESTful APIs、Flask、Django、Meteor)。
原文。经许可转载。
相关内容:
-
2018 年数据科学的前 20 个 Python 库
-
2018 年数据科学的前 20 个 R 库
-
顶级 6 种 Python NLP 库的比较