数据科学与大数据技术专业人才培养方案(21版)
数据科学与大数据技术专业人才培养方案一、专业名称、代码
专业名称 数据科学与大数据技术
学科门类 工学
二 级 类 计算机类
专业代码 080910T
英文名称 Data Science and Big Data Technology
二、专业培养目标
本专业培养德、智、体、美、劳全面发展,适应大数据时代经济社会发展需要,掌握数学、统计学、计算机科学与技术和数据科学的基础知识、基本理论和基本技能,具备较强的数据采集与管理、分析与应用、以及数据可视化能力,能在企事业、金融、医疗、教育等部门从事大数据相关领域的数据管理与分析、系统开发、技术服务等工作的高素质应用型人才。
毕业后五年的预期目标:
目标1:具备良好的道德修养和人文社会科学素养,能践行社会主义核心价值观,具有强烈的社会责任感,能在工程实践中综合考虑经济、环境、法律、安全、健康及可持续发展等因素的影响;
目标2:具备较强的工程实践能力,能基于科学原理,采用科学方法,运用现代工具,胜任数据采集与管理、分析与应用、以及数据可视化等工作;
目标3:具备自主学习和终身学习的意识与能力,能快速适应数据科学领域的发展变化,具有创新意识;
目标4:在工程实践中具备团队精神,能胜任组织管理者的角色。
三、毕业要求
经过4年的专业学习,毕业生应当具备以下基本的社会职业发展能力和基本的学科专业发展能力:
G1、工程知识:能够将数学、自然科学、工程基础和专业知识用于解决复杂数据工程问题。
G1.1:能够运用数学、统计学、计算机科学、数据科学的语言工具对工程问题进行表述;
G1.2:掌握数学、统计学、计算机科学、数据科学的基础知识,能够针对具体的问题建立数学模型并求解;
G1.3:能够将数据科学专业知识和数学模型应用于数据工程问题的推演和分析;
G1.4:能够运用数据科学专业知识和数学建模的方法,对数据工程问题的解决方案进行评估、比较、分析和综合。
G2、问题分析:能够应用数学、自然科学和工程科学的基本原理,识别、表达、并通过文献研究分析复杂数据工程问题,以获得有效结论。
G2.1:能够应用数据科学的基本原理,分析和识别数据复杂工程问题的关键点;
G2.2:利用数据科学知识,在分析和识别数据复杂工程问题的基础上,使用数学建模的方法进行描述和解决;
G2.3:能够通过文献研究,分析和选择数据复杂工程问题的多种解决方案,并且可以寻求可替代的解决方案;
G2.4:能够运用数据科学的基本原理,通过文献研究,对复杂数据工程问题进行分析和分解,获得有效的结论。
G3、设计/开发解决方案:能够设计针对复杂数据工程问题的解决方案,设计满足特定需求的系统、单元(部件)或工艺流程,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。
G3.1:利用数据科学的基本知识,针对数据复杂工程问题,给出可行的解决方案,并掌握影响方案实施的各种因素;
G3.2:能够利用数据科学领域的基本原理和设计方法,满足特定的数据处理与分析需求;
G3.3:能够针对具体应用领域进行完整的数据处理流程设计,并在设计中融入新技术和新方法;
G3.4:能够综合考虑实际应用中的安全、健康、安全、法律、文化以及环境等因素,给出合理的设计方案。
G4、科学研究:能够基于科学原理并采用科学方法对复杂计算机数据工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。
G4.1:能够基于数据科学的基本原理,通过文献研究或相关方法,调研和分析复杂数据工程问题的解决方案;
G4.2:具有根据对象特征,选择研究路线,设计出数据解决方案的能力;
G4.3:具有根据实验方案构建实验系统,安全地开展实验,并正确的采集实验数据的能力;
G4.4:能对实验结果进行分析和解释,并通过信息综合得到合理有效的结论。
G5、现代工具运用:能够针对复杂数据工程问题,开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具,包括对复杂数据工程问题的预测与模拟,并能够理解其局限性。
G5.1:了解数据采集、分析、管理、可视化等常用的技术工具和模拟软件的使用原理方法,并理解其局限性;
G5.2:掌握常用的数据采集、分析、管理、可视化工具,能够针对数据科学领域复杂工程问题,选择和使用恰当的技术、工具和模拟软件,对复杂工程问题进行分析、计算与设计;
G5.3:能够针对具体应用领域中的复杂数据工程问题,开发或使用恰当的技术和工具,建立模拟或预测模型,并能够理解模型的局限性。
G6、工程与社会:能够基于数据工程相关背景知识进行合理分析,评价数据工程实践和复杂数据工程问题解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。
G6.1:了解社会、安全、健康、法律等方面的基本知识,并能够基于数据科学的基础和应用知识,评价数据工程实践和复杂问题解决方案对社会、健康、安全、法律以及文化的影响;
G6.2:具有在数据工程实践中选择和应用恰当的解决方案的能力,能够分析并评价数据工程实践和复杂工程问题对社会、健康等方面的影响,并理解解决过程中所承担的相关责任。
G7、环境和可持续发展:能够理解和评价针对复杂数据工程问题的工程实践对环境、社会可持续发展的影响。
G7.1:基于数据科学的专业知识,理解与评价数据工程项目解决方案对环境、社会可持续发展的影响,从而知晓和理解环境保护和可持续发展的理念和内涵;
G7.2能够站在环境保护和可持续发展的角度思考数据工程实践的可持续性,评价数据工程实践中可能对人类和环境造成的损害和隐患。
G8、职业规范:具有人文社会科学素养、社会责任感,能够在工程实践中理解并遵守工程职业道德和规范,履行责任。
G8.1:了解中国国情,树立正确的人生观和价值观,具有良好的人文社会科学素养、具有较高的思想、文化、社会、道德素养;
G8.2:了解数据行业主要法律法规、遵守职业行为准则,在处理数据复杂工程问题的实践中,能够自觉遵守诚实、公正、守信的职业道德和规范;
G8.3:理解数据专业人才对公众的安全、健康和福祉,以及环境保护的社会责任,并且在处理数据复杂工程问题的实践中自觉履行这些责任。
G9、个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。
G9.1:具有与其它专业的成员沟通交流、合作共事的能力;
G9.2:具有较强的适应能力,能够在团队中独立或合作开展工作;
G9.3:具有一定的组织管理能力和人际交往能力,能够在多学科背景下听取团队中其他成员的意见与建议,胜任负责人的角色。
G10、沟通:能够就复杂数据工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达或回应指令,并具有一定的国际视野,能够在跨文化背景下进行沟通和交流。
G10.1:能够以口头、文稿、图表等方式,准确描述数据科学专业问题,回应质疑,理解与业界同行和社会公众交流的差异性;
G10.2:至少掌握一门外国语,能够阅读本专业的外文资料,了解国际专业发展趋势和研究热点,理解和尊重世界不同文化的差异性和多样性;
G10.3:具备跨文化交流的语言和书面表达能力,能就数据科学专业问题,在跨文化背景下进行沟通和交流。
G11、项目管理:理解并掌握计算机工程管理原理与经济决策方法,并能在多学科环境中应用。
G11.1:掌握数据工程项目中涉及的管理与经济决策方法,能够在多学科环境下对数据工程项目进行经济效益和社会效益分析,分析判断其综合效益;
G11.2:理解数据工程管理的基本理念,具备基本的数据工程项目管理学知识,能够建立和使用合适的管理和质量保证体系,并且将其应用于数据工程的成本分析中;
G11.3:能够运用数据工程管理与经济决策方法,在多学科环境中组织并管理数据工程实践的计划和预算、协调组织任务、合理调配资源,提升项目组的工作质量和效率。
G12、终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力。
G12.1理解数据科学的发展对于知识和能力的影响和要求,具有识别和洞察数据科学领域知识发展和新研究方向的能力,认识到自主学习和终身学习的必要性;
G12.2具有自主学习的能力,具有批判性思维意识并能够运用适当的逻辑和智力标准分析、判断和决策,能进行批判性自我评价与绩效评估,并以此作为追踪个人发展需要和成就的主要手段。
四、课程及教学活动与毕业要求关联矩阵
1、毕业要求对培养目标的支撑矩阵
2、课程与毕业要求的关联矩阵
五、主干学科
数学;统计学;计算机科学与技术
六、专业核心课程
数据科学与大数据技术专业核心课程:高等数学、线性代数、概率论与数理统计、大数据导论、Linux应用基础、离散数学、数据结构、操作系统、Python数据分析、数据可视化、Java语言程序设计、应用多元统计分析、机器学习、数据库原理与应用、应用时间序列、数值分析、大数据技术与应用等。
高等数学(10学分,162学时):本课程主要包括一元函数极限与连续、一元函数微分学、一元函数积分学、常微分方程、向量代数与空间解析几何、多元函数的极限与连续、多元函数微分学、重积分、曲线积分与曲面积分;级数等内容。通过本课程的学习,使学生掌握函数的微积分等基本理论和基本思想,能应用这些理论和方法解决实际生活中提出的理论和实际问题,为进一步学习后续各门课程提供必需的基础知识和基本方法。
线性代数(4学分,72学时):本课程主要包括行列式理论、矩阵理论、线性方程组、线性空间、线性变换、欧氏空间、二次型等内容。通过本课程的学习,使学生初步掌握基本的、系统的代数知识,以及抽象的、严格的代数方法,培养学生的抽象思维能力、逻辑推理能力和和解决问题的能力,为后续课程的学习提供必需的基本知识和学习能力。
概率论与数理统计(3学分,60学时):本课程主要包括随机事件与随机事件的概率、随机变量的分布及随机变量的数字特征、随机变量的大数定理与中心极限定理、参数估计、假设检验、非参数检验等内容。通过本课程的学习,使学生初步掌握处理随机现象的基本理论和方法,从而使学生能够把所学的知识应用于实际问题中,并与其它数学分支相互渗透。
大数据导论(2学分,30学时):本课程主要包括大数据可视化方法、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家等内容。通过本课程的学习,使学生了解大数据处理的相关原理和技术,对大数据的基本概念与关键技术有一个全方位的了解,为后续专业课的学习打下坚实的基础。
Linux应用基础(1.5学分,30学时):本课程主要包括安装Linux操作系统、文件管理与常用命令、用户与用户组管理、软件包管理RPM和YUM数据库、Linux编程、进程管理、Shell编程等主要内容。通过本课程的学习,使学生能够熟练掌握Linux的基本操作、基本命令,能在Linux环境中进行常用软件的安装与卸载,能够进行简单的网络环境配置,为后续专业核心课的学习奠定基础。
离散数学(3学分,60学时):本课程主要包括命题逻辑的基本概念、命题逻辑等值演算、命题逻辑的推理理论、集合代数、函数、图、树、欧拉图与哈密顿图等内容。通过本课程的学习,使学生对数理逻辑、集合论、代数系统和图论有系统而较为深刻的认识,提高学生的抽象思维、逻辑推理和运算能力;以及应用离散数学知识建立计算模型解决实际问题的能力,为学生学习数据科学与大数据技术专业的后续课程奠定理论基础。
数据结构(3.5学分,64学时):本课程主要包括线性表、栈和队列、串、数组和广义表、树和二叉树、图、查找、内部排序等内容。通过本课程的学习,使学生能够理解数据表示和数据处理的重要性,培养良好的数据表示和处理能力,初步掌握算法设计与分析方法,为学习操作系统、算法分析与设计和数据库等课程奠定基础。
操作系统(3学分,45学时):本课程主要包括进程的描述与控制、进程的描述与控制、存储器管理、输入输出系统、文件管理等内容。通过本课程的学习,使学生掌握操作系统的基本类型、特征和功能,熟悉操作系统各个组成部分的基本结构和原理,掌握进程管理、存储管理、设备管理、文件管理及作业管理等涉及的概念和相关算法,为后续相关课程的学习奠定坚实的理论基础。
Python数据分析(3学分,60学时):本课程主要内容包括基本数据类型、程序的控制结构、函数和代码复用、组合数据类型、文件和数据格式化、程序设计方法论、科学计算和可视化等内容。通过本课程的学习,使学生掌握Python编程技能和面向对象软件设计思想,能够综合利用Python技术解决本专业的具体问题,提高学生的编程能力,为大数据的分析及应用等奠定良好的基础。
数据可视化(2学分,48学时):本课程主要数据可视化基本概念、视觉感知和认知的基本原理、可视化的基础理论和编码原则、不同类型数据的可视化方法及可视化编程实现等内容。通过本课程的学习,使学生具有进行数据可视化应用的能力,能够根据现实生活中的具体应用问题,结合实际业务需求和场景,选择合适的可视化方法,具有较高的数据科学素养。
Java语言程序设计(3学分,64学时):本课程主要包括Java语言基础知识、选择结构、循环结构程序设计、数组、面向对象编程等内容。通过本课程的教学,使学生掌握面向对象的编程设计思想,提高学生在软件设计过程中分析问题和解决问题的实际动手能力,使学生的理论知识和实践技能得到共同发展。
应用多元统计分析(3.5学分,64学时):本课程主要包括定性数据的卡方检验、多元正态分布、均值向量与协方差阵的检验、聚类分析、因子分析、主成分分析及典型相关分析等内容。通过本课程的学习,使学生能够熟练掌握和运用统计方法,为数据的分析及应用奠定坚实的基础。
机器学习(3学分,64学时):本课程主要包括K近邻、广义线性模型、朴素贝叶斯、决策树与随机森林、支持向量机、神经网络等内容。通过本课程的学习,使学生掌握主流学习方法和模型,并能根据实际问题的需要选择并实现相应的算法,为大数据的分析及应用等奠定良好的基础。
数据库原理与应用(3.5学分,64学时):本课程主要包括关系数据库、关系系统及其查询优化、数据库设计、数据库维护等内容。通过本课程的学习,使学生掌握数据库基本理论及应用设计,了解典型数据库系统的体系结构,培养学生使用、评价和为实际环境选择数据库系统、构建软件平台以及进行应用开发的能力。
应用时间序列(3.5学分,64学时):本课程主要包括时间序列的预处理、平稳时间序列分析、非平稳序列的确定性分析及随机分析、多元时间序列分析等内容。通过本课程的学习,让学生利用时间序列这种特殊的数据结构,结合统计软件数据分析,观察经济生活中数据变量的发展规律,预测其将来走势,为数据分析与应用奠定基础。
数值分析(3.5学分,64学时):本课程主要包括插值法、数值积分与数值微分、解线性方程组的直接方法、解线性方程组的迭代法、非线性方程求根等内容。通过本课程的学习,使学生掌握用数值分析方法解决实际问题的算法原理及理论分析,提高学生应用数学知识分析和解决实际问题的能力。
大数据技术与应用(3学分,64学时):本课程主要包括大数据术概论、Hadoop的架构与组成、HDFS和Common、Spark平台、Spark处理架构等内容。通过本课程的学习,使学生掌握大数据的技术架构、大数据的整体技术、大数据分析的典型工具以及大数据未来发展趋势,为从事大数据相关行业奠定扎实基础。
七、教学大纲
根据《运城学院课程教学大纲管理办法》,制定本专业人才培养方案中所涉及的全部课程的教学大纲。
八、主要实践环节
专业见习、专业实习、毕业实习、毕业论文(设计)、大学生科技创新实践等。
九、学制和学分要求
本专业实行学年学分制,修业年限为四年,要求修满166学分。
十、毕业条件
学生四年学习期满,完成并通过本培养方案规定的全部教学环节,修满规定学分,达到大学生体质健康标准,方可毕业。
十一、学位授予
本科毕业生符合学位授予条件的,经学院学位评定委员会批准,可授予工学学士学位。
十二、课程体系的构成及学时学分比例
课程类别 |
课程 性质 |
学分 | 学 时 | 备注 | ||||
总学时 | 理论 | 实验 | 实践 | |||||
通识教育课程 | 必修 | 38 | 688 | 642 | 46 | |||
选修 | 8 | 128 | 128 | |||||
专业教育课程 | 学科基础课 | 必修 | 34 | 602 | 468 | 62 | 72 | |
专业核心课 | 必修 | 36 | 713 | 443 | 270 | |||
专业选修课 | 选修 | 15 | 256 | 160 | 96 | |||
集中实践课程 | 必修 | 35 | ||||||
合 计 | 166 | 2387 | 1841 | 428 | 118 | |||
总学分_166 ;总学时_2387 ,其中理论学时 1841 ,实践实验学时_ 546 _。 集中实践学分_35_;实践教学(含课内实验)总学分_ 52 _,占专业总学分_31_%。 必修课学分_143_,占总学分86_%;选修课学分_23_,占专业总学分_14_%。 |