数据挖掘实验2——数据可视化

数据挖掘实验2——数据可视化

W1ndys Lv6

实验目的

  1. 学习使用 Python 中的 Matplotlib 包进行数据可视化。

实验仪器与设备

  1. 计算机 1 台
  2. 配置好的 python 环境

实验内容

  1. 根据实验文献,以车辆燃油消耗数据集为基础,进行数据可视化学习。
  2. 基于 Iris 数据集进行可视化分析练习。根据所学知识从多角度用不同的图表进行可视化。

实验步骤

  1. 学习教师所给的资料。
  2. 编程实现实验内容。

提交要求

  1. 按照学院的实验报告模板,撰写实验报告,实验报告格式见最下方,命名规则:学号-姓名-实验二-数据挖掘实验报告。
  2. 附上实验代码,导出为.py 的文件上传。
  3. 实验发布及提交平台:知心教管平台。

实验代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

# 加载数据
data = pd.read_csv("iris/iris.csv")

# 创建一个图形框架,设置大小
plt.figure(figsize=(20, 12))

# 子图1: 条形图
plt.subplot(3, 3, 1)
sns.barplot(x="Species", y="Sepal.Length", data=data)
plt.title("Sepal Length by Species")

# 子图2: 饼图
plt.subplot(3, 3, 2)
data["Species"].value_counts().plot.pie(autopct="%1.1f%%")
plt.title("Species Distribution")
plt.ylabel("") # 移除y标签

# 子图3: 直方图
plt.subplot(3, 3, 3)
sns.histplot(data["Sepal.Length"], kde=False)
plt.title("Sepal Length Histogram")

# 子图4: 核密度图
plt.subplot(3, 3, 4)
sns.kdeplot(data["Sepal.Length"], shade=True)
plt.title("Sepal Length KDE")

# 子图5: 箱形图
plt.subplot(3, 3, 5)
sns.boxplot(x="Species", y="Sepal.Length", data=data)
plt.title("Sepal Length Boxplot by Species")

# 子图6: 散点图
plt.subplot(3, 3, 6)
sns.scatterplot(x="Sepal.Length", y="Sepal.Width", hue="Species", data=data)
plt.title("Sepal Length vs Sepal Width")

# 子图7: 折线图
plt.subplot(3, 3, 7)
sns.lineplot(x="Petal.Length", y="Petal.Width", hue="Species", data=data)
plt.title("Petal Length vs Petal Width")

# 调整子图间距
plt.tight_layout()
plt.show()
  • 标题: 数据挖掘实验2——数据可视化
  • 作者: W1ndys
  • 创建于 : 2024-09-15 00:31:27
  • 更新于 : 2025-01-17 20:28:48
  • 链接: https://blog.w1ndys.top/posts/3110e11b.html
  • 版权声明: 版权所有 © W1ndys,禁止转载。
评论