作者:乔山办公网日期:
返回目录:excel表格制作
这就是文件路径找不到百嘛,正确指定文件路径就能打开了。
软件通常运行时打开文件如不特别度指明路径,会在默认的知路径下去找这个文件,如找到就打开,如找不到就报错。
如未道设置或修改,默认路径就版是你执行的这个文件所在的目录。你可wage1<- read.csv("wage1.csv")运行,但把文权件wage1.csv与wage1放在同一目录下试试。
针对csv格式,直接用read.csv即可;如果是xls或者xlsx格式,可以用RODBC包,对于excel 2007以上版本可以用xlsx包。
RODBC包示例:
library(RODBC)
channel <-odbcConnectExcel("myfile.xls")
mydataframe <- sqlFetch(channel, "MySheet")
odbcClose(channel)
xlsx包示例:
library(xlsx)
workbook <-"c:/myworkbook.xlsx"
mydataframe <- read.xlsx(workbook, 1)
原文来自人大经济论坛,出处参考: http://bbs.pinggu.org/forum.phpmod=viewthread&tid=3156546&page=1
另外的参数设置可以参e69da5e6ba90e799bee5baa6362考RODBC和xlsx两个包的帮助文档,在导入后通过help查看。
R语言读取excel文件文件其实有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安装并载入读取excel文件所用的包:
install.packages("xlsx") library(xlsx)
或者,
install.packages("readxl") library(readxl)
两个包的基本介绍
xlsx是用R把excel文件中的工作表以data.frame的格式读入R语言,他有两个常用函数,其中read.xlsx2通常会比read.xlsx读取的速度更快一些,因为它的好多工作是利用Java完成e799bee5baa6e79fa5e98193e59b9ee7ad94332的,所以速度有所提升,但是在读取子数据集的时候没有read.xlsx稳定性好。
read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)
read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)
注:
sheetIndex:工作表单号
rowIndex:行号,就是你想读取那些行
header:表头,就是有没有列名。比如姓名,年龄,学号等
startRow:比如你想从第五行开始读取,就设置startRow = 5
readxl包可以用来读取xls和xlsx格式的文件
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)
注:
sheet:读取的工作表
col_names: 如果是FALSE的话,就表示第一行不是列名,R会自动给你取成x1,x2...
colt_types: blank,numeric,date,text
na: 缺失值,默认空着的单元是缺失值,你也可以自己指定,比如认为999是缺失值