8000 GitHub - longcd/titanic_survival_exploration: Kaggle泰坦尼克之灾
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

longcd/titanic_survival_exploration

Repository files navigation

预测泰坦尼克号乘客幸存率

安装要求

这个项目要求使用 Python 3.5.2 以及安装下列python库

你还需要安装和运行 Jupyter Notebook

推荐安装 Anaconda,一个包含了项目需要的所有库和软件的 Python 发行版本。这里介绍了如何安装Anaconda。

代码

事例代码在 titanic_survival_exploration_cn.ipynb 文件中,辅助代码在 titanic_visualizations.py 文件中。

运行

在命令行中,确保当前目录为 titanic_survival_exploration/ 文件夹的最顶层(目录包含本 README 文件),运行下列命令:

$ jupyter notebook titanic_survival_exploration.ipynb

这会启动 Jupyter Notebook 把项目文件打开在你的浏览器中。

对jupyter不熟悉的同学可以看一下这个链接:

数据

这个项目的数据包含在 titanic_data.csv 文件中。文件包含下列特征:

  • Survived:是否存活(0代表否,1代表是)
  • Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)
  • Name:船上乘客的名字
  • Sex:船上乘客的性别
  • Age:船上乘客的年龄(可能存在 NaN
  • SibSp:乘客在船上的兄 56AD 姐妹和配偶的数量
  • Parch:乘客在船上的父母以及小孩的数量
  • Ticket:乘客船票的编号
  • Fare:乘客为船票支付的费用
  • Cabin:乘客所在船舱的编号(可能存在 NaN
  • Embarked:乘客上船的港口(C 代表从 Cherbourg 登船,Q 代表从 Queenstown 登船,S 代表从 Southampton 登船)

About

Kaggle泰坦尼克之灾

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
0