1.1.1 数据分析的分类
数据分析是一个很庞大的领域。用于商业决策的数据分析方法主要分为业务描述性分析方法与数据挖掘分析方法两大类。
业务描述性分析是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应用等步骤在内的一整套分析流程。
数据挖掘是一个横跨计算机、数学、统计学等学科的科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现信息的计算过程。数据分析的工作内容涵盖数据挖掘的工作内容。
数据分析在企业中可分为宏观分析和微观分析两大类。前者站在企业经营和运营的视角,为决策层和管理层提供数据支持;后者站在客户的视角,进行客户洞察,挖掘客户需求和匹配产品与服务,落地自动触发策略。根据业务实践,我们将数据科学在企业中的应用分为宏观层面分析、微观个体分析两个层面,数据分析的分类如图1-1所示。
图1-1 数据分析的分类
CDA LEVEL Ⅰ考试考查考生是否具备根据已经发生及正在发生的业务实际情况,收集和应用各种业务数据,进行准确、深入、全面、易懂的数据描述的能力。CDA LEVEL Ⅰ需要考生掌握的知识主要以解决业务宏观层面的问题为主,通过对业务数据进行描述性分析,帮助经营决策者及时发现宏观业务问题、做出正确判断、及时解决问题,最终达到帮助企业提高经营收益的目的。
CDA LEVEL Ⅱ考试内容涉及宏、微观相结合的分析,要求考生掌握数据治理和商业分析方法;能够针对不同的业务提出基于统计模型及数据模型的解决思路,根据不同的数据业务需求选择合适的算法进行分析与处理;能够完整准确地输出数据分析报告,实现数据模型落地。
CDA LEVEL Ⅲ考试内容主要涉及微观个体分析,要求考生掌握算法模型和数据特征处理方法,能够针对不同的应用场景提出基于算法模型的解决思路;掌握文本、图像、声音等非结构化数据的分析方法;能够完整准确地输出分析结果,实现模型落地;能够紧跟业务与技术发展方向,时刻站在行业前沿。