乔山办公网我们一直在努力
您的位置:乔山办公网 > excel表格制作 > 如何才能拿R读取<em>Excel</em>文件

如何才能拿R读取<em>Excel</em>文件

作者:乔山办公网日期:

返回目录:excel表格制作


一、 安装RODBC库
  1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择“程序包/安装程序包
  
  2、在弹出的窗口里往下拉,选择RODBC如图,点击确定

  3、在ODBC数据源管理器里将需要的数据库添加进去,这里笔者使用的是SQL Server2008,驱动程序选择Native Client10.0
  

3、在R语言窗口输入连接语句

R语言读取excel文件文件其实有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安装并载入读取excel文件所用的包:
install.packages("xlsx") library(xlsx)

或者,
install.packages("readxl") library(readxl)

两个包的基本介绍
xlsx是用R把excel文件中的工作表7a64e78988e69d83332以data.frame的格式读入R语言,他有两个常用函数,其中read.xlsx2通常会比read.xlsx读取的速度更快一些,因为它的好多工作是利用Java完成的,所以速度有所提升,但是在读取子数据集的时候没有read.xlsx稳定性好。
read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)
read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)
注:
sheetIndex:工作表单号
rowIndex:行号,就是你想读取那些行
header:表头,就是有没有列名。比如姓名,年龄,学号等
startRow:比如你想从第五行开始读取,就设置startRow = 5
readxl包可以用来读取xls和xlsx格式的文件
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)
注:
sheet:读取的工作表
col_names: 如果是FALSE的话,就表示第一行不是列名,R会自动给你取成x1,x2...
colt_types: blank,numeric,date,text
na: 缺失值,默认空着的单元是缺失值,你也可以自己指定,比如认为999是缺失值
最简答方法,把你想读的excel文件另存为csv(csv只有一张表),假设你的csv叫做test.csv 路径在 “/user/desktop/test.csv”
然后我们用:table -> read.csv(“/user/desktop/test.csv”, header = T) 来读取
这样table这个变量就存着你这张表的所有信息了

做分析没有数据真是一大悲剧,正是无源之水、无根之木再加上无米之炊。通常我们搜寻到的数据格式主要有文本格式、Excel格式和SPSS格式。当然也会有从数据库等其它途径进来,这不在本文讨论范围内。
一般的文本格式导入,都可以用read.table命令把数据扔进R里面。Excel和Spss数据的话,可用相应软件将文件打开,观察数据结构后将其复制到剪贴板,然后一样可以用read.table('clipboard')扔到R里面。如果文件太大不好复制,那么可以利用Excel和Spss的导出功能,将数据导出成文本格式。
还有一种情况就是,你的计算机上没有安装Excel或是Spss,这数据导入就要用到RODBC扩展包了。首先装载RODBC包。然后输入数据文件的绝对路径(要注意是用/而不是\)来定义连接,最后用数据抓取命令获取你需要的标签页数据内容(Sheet1)。
library(RODBC)
channel=odbcConnectExcel("d:/test.xls")
mydata=sqlFetch(channel,'Sheet1')这样简单的两个步骤就可以将Excel数据导入R的mydata变量中。如果是Excel2007格式数据则e799bee5baa6e997aee7ad94e4b893e5b19e361要换一个函数
channel=odbcConnectExcel2007('d:/test.xlsx')
mydata=sqlFetch(channel,'Sheet1')导入spss的sav格式数据则要用到foreign扩展包,加载后直接用read.spss读取sav文件
library(foreign)
mydata=read.spss('d:/test.sav')上面的函数在很多情况下没能将sav文件中的附加信息导进来,例如数据的label,那么建议用Hmisc扩展包的spss.get函数,效果会更好一些。

相关阅读

  • 如何才能拿R读取<em>Excel</em>文件

  • 乔山办公网excel表格制作
  • 一、 安装RODBC库 百 1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择度“程序知包/安装程序包     2、在弹出的窗口里往下拉,选择RODBC如图,点击确定  3、在ODBC数据源管理器
  • <em>excel</em>2010中<em>Rectangle</em>

  • 乔山办公网excel表格制作
  • 1、首先需要抄excel加载项中选择“DIY工具箱”,选择导入图片功能;2、在袭弹出的对话框中选择“添加”按钮;3、找到图片路径,全选需要导入的图片,然后点击打开;4、在弹出的对
  • 正则表达式如何匹配<em>excel</em>文件

  • 乔山办公网excel表格制作
  • 正则表达式进行模糊copy替换的例子代码百:Sub TestReplace()Dim ss, re, rv ss = "12苏5a中国度人民一二d三"& vbNewLine &"egg其d中国人民四a1五六"& vbNewLine&"凡dsf事都美国纽约问AAFa分"& vbNewLine&"发的事
关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网