共享单车需求数据集

40次
2023-03-11

2、共享单车需求数据集

这个数据集非常有趣。它对于初学者来说有点复杂,但也正因如此,它很适合拿来做练习。它包含了华盛顿特区“首都自行车共享计划”中自行车租赁需求的数据,自行车共享和租赁系统通常是很好的信息来源。这个数据集包含了有关骑行持续时间、出发地点、到达地点和经过时间的信息,还包含了每一天每小时的天气信息。

共享单车需求数据集 (http://ds.jsai.org.cn/) 机器学习 第1张

2.1 数据集样本

我们加载数据,看看它是什么样的。首先,我们使用数据集的每小时数据来执行操作:

<span class="n">data</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="n">f</span><span class="s2">".</span><span class="se">\\</span><span class="s2">Datasets</span><span class="se">\\</span><span class="s2">hour.csv"</span><span class="p">)</span>
<span class="n">data</span><span class="o">.</span><span class="n">head</span><span class="p">()</span>
共享单车需求数据集 (http://ds.jsai.org.cn/) 机器学习 第2张

每日数据是下面的样子:

<span class="n">data</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="n">f</span><span class="s2">".</span><span class="se">\\</span><span class="s2">Datasets</span><span class="se">\\</span><span class="s2">day.csv"</span><span class="p">)</span>
<span class="n">data</span><span class="o">.</span><span class="n">head</span><span class="p">()</span>
共享单车需求数据集 (http://ds.jsai.org.cn/) 机器学习 第3张

2.2 这个公共数据集适合解决什么问题?

由于该数据集包含的信息种类繁多,因此非常适合练习解决回归问题。你可以尝试对其使用多元线性回归,或使用神经网络。

2.3 有用的链接

在以下链接中可以获得关于该数据集的更多信息:

  • UCI(archive.ics.uci.edu/ml/)
  • Kaggle(kaggle.com/c/bike-shari)
END

发表评论