博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《机器学习与数据科学(基于R的统计学习方法)》——2.5 读取CSV文件
阅读量:5963 次
发布时间:2019-06-19

本文共 1053 字,大约阅读时间需要 3 分钟。

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第2章,第2.5节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.5 读取CSV文件

可能你遇到的最常见的数据文件类型是逗号分隔值(CSV)文件类型。这是因为CSV是数据科学社区的通用语言,并且很多软件应用导出的数据格式是CSV。同样地,大多数软件应用和环境(如R)能够读取CSV文件。如果你不熟悉一个CSV文件的样子,只要在诸如Windows记事本(Notepad)这样的工具中打开它即可。CSV文件的格式很简单:文件中的每一行代表了一个观测值,每一列代表一个变量(潜在的特征变量)。R能处理第一行包含一个变量名列表的情况,也能处理第一行丢失的情况(在这种情况下,R会任意分配变量名,你可以在之后重新命名变量)。

一旦你得到了CSV文件,第一步就是把它放进工作目录中。为了将CSV的内容读进内存中以便后续在R中使用,你可以用read.table()函数,这是R提供的把文件读入成为表格形式的一般方法,不单单适用于CSV格式。read.csv()的功能基本和read.table()相同,只不过它只能读取CSV格式,而这种格式通常是由Excel这样的电子表格应用导出的。不论使用哪个函数,文件都被读入数据框对象中。为了演示这部分内容,我们将读入前面的停车计时器数据集。

> SFParkingMeters <- read.csv("./data/SFParkingMeters.csv")```成功将文件读入之后,你可以用两种方法让内容显示在RStudio中,一种是在Workspace窗格中单击数据框的名称SFParkingMeters;另一种在控制台中输入指令view(SFParketingMeters)。图2-2显示了你将看见的结果。你可以像在电子表格中那样浏览数据,不同的是,这里不允许编辑。我们注意到,这个数据集有29 253条观测值和116个变量。如果你只想看这个数据框的前6行,也可以使用head(SFParkingMeters)。
另一种有用的读入文件的方式是使用file.choose()函数,它可以嵌入到read.table()或者read.csv()中。这种读文件的方式会弹出一个提示框,提醒选择指向计算机中的哪个文件。

SFParkingMeters <- read.csv(file.choose())`

转载地址:http://jlnax.baihongyu.com/

你可能感兴趣的文章
Atom 编辑器系列视频课程
查看>>
[原][osgearth]osgearthviewer读取earth文件,代码解析(earth文件读取的一帧)
查看>>
阿里百川码力APP监控 来了!
查看>>
使用dotenv管理环境变量
查看>>
温故js系列(11)-BOM
查看>>
Vuex学习
查看>>
bootstrap - navbar
查看>>
切图崽的自我修养-[ES6] 编程风格规范
查看>>
服务器迁移小记
查看>>
FastDFS存储服务器部署
查看>>
Android — 创建和修改 Fragment 的方法及相关注意事项
查看>>
swift基础之_swift调用OC/OC调用swift
查看>>
Devexpress 15.1.8 Breaking Changes
查看>>
Java B2B2C多用户商城 springcloud架构- common-service 项目构建过程(七)
查看>>
ElasticSearch Client详解
查看>>
新零售讲堂之时代下的传统零售业,何去何从?
查看>>
c++读取和写入TXT文件的整理
查看>>
linux安全问答(1)
查看>>
mybatis update返回值的意义
查看>>
expdp 详解及实例
查看>>