数据科学与大数据技术
-
2025年秋江苏开放大学大数据可视化作业三答案
(一)阅读课程文本内容,结合视频的学习回答问题。 (二)实验操作: 观看视频,以课程提供的Excel“实践项目 1-2014 年各省市售电量明细表.xlsx”文件作为数据源,执行Tableau可视化设计操作,实际体验Tableau可视化的各项操作。可视化设计的具体步骤如下: 步骤1:建立 Tableau 工作薄。 步骤2:转换字段类型。 步骤3:创建工作表。…
-
2025年秋江苏开放大学大数据可视化作业二答案
作业要求: (一)阅读本章案例,结合“Tableau案例分析:世界指标——人口”回答下列问题。 (二)实验操作:观看视频,以Tableau系统提供的Excel“示例 – 超市”文件作为数据源,执行Tableau数据管理操作,实际体验Tableau数据管理的各项操作。 (三)实验总结
-
2025年秋江苏开放大学机器学习作业一答案
一、2025年秋江苏开放大学机器学习作业一单选题答案 1、关于特征选择,下列对Ridge回归和Lasso回归说法正确的是? A、Lasso回归适用于特征选择 B、Ridge回归适用于特征选择 C、以上说法都不对 D、两个都适用于特征选择 学生答案:A 2、下列关于Min-Max标准化的说法正确的是() A、经Min-Max标准化后的特征的样本方差不确定 B、…
-
2025年秋江苏开放大学大数据可视化作业一答案
一、2025年秋江苏开放大学大数据可视化作业一单选题答案 1、极坐标图形是使用()来绘制的。 A、原点和半径 B、相角和距离 C、横纵坐标 D、原点和相角 学生答案:B 2、关于pyecharts的描述,下列说法错误的是()。 A、pyecharts支持链式调用 B、pyecharts程序可以集成至Django框架中 C、pyecharts的配置项可以轻松地…
-
2024年春江苏开放大学机器学习综合大作业:基于分类算法的肝病诊断
作业要求: 一.实验内容: 本案例基于UCI公开的肝病患者诊断数据,从患者生理指标和医疗检测指标出发,使用单一分类器和集成方法对患者是否患肝病进行预测分析。首先,我们对数据进行了预处理和探索性分析,挖掘出数据的内在联系;之后,借助sklearn中的各种分类模块进行预测;最后,比较不同分类器下的预测效果。 下载数据集indian_liver_patient.c…
-
2024年春江苏开放大学机器学习实验及技能训练(四):根据学习者在学习活动中的特征预测学生的成绩等级
实验四:根据学习者在学习活动中的特征预测学生的成绩等级 1. 实践目标: 掌握主流的分类模型的实现方法,包括逻辑回归、K近邻、决策树、朴素贝叶斯、支持向量机等。 2. 实践内容: 根据学习者在学习活动中的特征预测学生的成绩等级。 3. 实践操作: 在虚拟实验平台完成对应实验,并撰写实验报告在此处上传。 参考范文两篇,自行修改,防…
-
2024年春江苏开放大学机器学习实验及技能训练(二):共享单车时租数量预测
实验二:共享单车时租数量预测 1. 实践目标: 掌握数据预处理的基本方法,包括缺失值异常值处理、标准化、离散化、特征编码等。 2. 实践内容: 利用城市当天的天气、温度、湿度和风速等环境信息对自行车的租借数量进行有效预测,预测每小时内租用的自行车总数。 3. 实践操作: 在虚拟实验平台完成对应实验,并撰写实验报告在此处上传。 参…
-
2024年春江苏开放大学机器学习形考作业一高分答案
一、2024年春江苏开放大学机器学习形考作业一单选题答案 1、如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的? A、测试样本误差不可能为零 B、以上答案都不对 C、测试样本误差始终为零 D、不确定 学生答案:B 2、下列模型中属于回归模型的是? A、线性回归 B、DBSCAN C、逻辑回归 D、ID3 学生答案:A…
-
2024年春江苏开放大学机器学习形考作业二高分答案
一、2024年春江苏开放大学机器学习形考作业二单选题答案 1、下列关于软投票说法错误的是? A、投票表决器可以组合不同的基分类器 B、使用概率平均的⽅式来预测样本类别 C、可以对每个基分类器设置权重,⽤于对预测概率求进⾏加权平均 D、软投票过程中每个基分类器都预测⼀个类别 学生答案:D 2、下列有关词袋表示法的理解有误的是() A、将每个⽂本对应词表转化为特…
-
江苏开放大学数据采集与预处理BBS2:请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么?
请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么? 评判依据: 1.按要求进行讨论,内容充分、合理,为有效帖,得分; 2.如讨论内容与主题无关,或字数欠缺,或复制他人发帖,为无效帖,不得分。 参考答案:数据清洗是数据预处理的重要环节,它的主要目的在于提高数据的质量和准确性,使得数据更适用于进一步的分析、建模…