09.05.2015 Views

R 数据导入和导出.pdf - 数学建模学习资源网站

R 数据导入和导出.pdf - 数学建模学习资源网站

R 数据导入和导出.pdf - 数学建模学习资源网站

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

R-data (2.2.1) 刘 重 杰 翻 译 初 稿<br />

首 个 字 段 作 为 行 名 称 , 可 以 通 过 如 下 方 式 实 现 read.table("file.dat", header = TRUE, row.names<br />

= 1)⃞ 列 名 称 可 以 显 式 的 通 过 col.names 参 数 实 现 , 显 式 的 名 称 将 不 考 虑 首 行 ⃞<br />

3⃝ 分 隔 符 : 一 般 来 说 , 可 以 看 到到 文 件 内 容 就 知 道 字 段 之 间 的 分 隔 符 , 但 是 字 段 间 有 空<br />

格 的 时 候 , 可 能 是 缺 失 的 参 数 sep = "", 可 以 代 表 任 意 间 隔 ( 空 格 ⃝ 制制 表 符 或 者 回 车 ) 作 为<br />

分 隔 符 ⃞ 请 注 意 , 选 择 的 分 隔 符 会 影 响响 到到 带 有 引 号 的 字 符 串 ⃞ 如 果 在 制制 表 符 分 隔 符 的 文 件 中<br />

包包 含 空 字 段 , 请 使 用 sep = "\t" 作 为 参 数 ⃞<br />

4⃝ 引 号 : 默 认 情 况 下 , 字 符 串 使 用 单 引 号 或 者 双 引 号 , 这 时 候 所 有 字 符 中 的 引 号 都 作<br />

为 一 部 分 来 匹 配 ⃞ 引 号 的 有 效 设 置 通 过 quote 参 数 来 控 制制 ⃞ sep ="\n" 默 认 的 改 变 quote = ""⃞<br />

如 果 没 有 指 定 分 隔 符 , 没 有 被 引 字 符 串 前前 面 使 用 c 语 言 形 式 的 ‘\’⃞ 如 果 指 定 了 分 隔 符 , 被<br />

引 用 字 符 串 中 的 引 号 在 电 子 表 格 文 件 中 连 续 两 次 出 现 当 作 通 常 的 一 个 字 符 ⃞ 比 如 ,<br />

read.table("testfile", sep = ",") 方 式 可 以 读 取 ’One string isn’’t two’,"one more" , 而 不 会 对<br />

缺 省 的 分 隔 符 产 生 作 用 ⃞<br />

5⃝ 缺 失 值 : 默 认 情 况 下 , 包包 含 NA 的 字 符 代 表 缺 失 值 , 不 过 可 以 通 过 na.strings 参 数 来<br />

改 变 设 置 ,na.strings 是 包包 含 一 个 和和 几 个 表 示 缺 失 值 的 字 符 ⃞ 数 值 列 中 空 值 也 被 视 作 缺 失 值 ⃞<br />

在 数 值 列 中 ,NaN⃝Inf 和和 -Inf 是 合 法 的 ⃞<br />

6⃝ 尾 行 : 通 常 从 电 子 文 档 格 式 文 件 中 导 入 的 数 据 的 时 候 , 用 参 数 fill=TRUE 省 略 尾 部<br />

空 字 段 ⃞<br />

7⃝ 字 符 型 字 段 中 的 空 格 : 如 果 指 定 了 分 隔 符 , 字 符 型 字 段 中 前前 后 空 格 作 为 字 段 的 部 分 存<br />

在 , 若 想 去 掉 这 些 空 格 , 使 用 参 数 strip.white=TRUE.<br />

8⃝ 空 白 行 : 缺 失 情 况 下 ,read.table 函 数 略 过 空 白 行 ⃞ 可 以 通 过 参 数 blank.lines.skip=FALSE<br />

来 改 变 设 置 , 这 是 需 要 配 套 使 用 参 数 fill=TRUE⃞<br />

9⃝ 变 量 的 类 : 除 非 你 有 特 别 的 指 定 ,read.table 函 数 为 数 据 框 中 的 每 一 个 变 量 自 动 选 择<br />

一 个 合 适 的 类 ⃞ 遵 照 如 下 的 顺 序 :logical, integer, numeric and complex, 略 过 无 法 转 化化 的 部<br />

分 ⃞ 如 果 以 上 所 有 都 失 败 了 , 变 量 转 化化 为 因 子 (factor)⃞ 参 数 colClasses 和和 as.is 提 供 了 更 强<br />

的 控 制制 ,as.is 禁 止 字 符 型 向 量 转 化化 为 因 子 ⃞ 使 用 colClasses 参 数 可 以 在 输 入 数 据 的 时 候 为 各<br />

列 指 定 类 ⃞ 需 要 注 意 的 是 ,colClasses 和和 as.is 参 数 用 来 指 定 各 列 , 不 是 针 对 每 个 变 量 , 于 是<br />

包包 含 了 行 名 的 那 一 列 ( 如 果 这 列 存 在 的 话 )⃞<br />

10⃝ 注 解 : 缺 省 情 况 下 ,read.table 函 数 使 用 ‘#’ 作 为 注 释 字 符 , 如 果 被 读 入 了 , 该 行<br />

剩 下 的 部 分 将 被 省 略 掉 ( 除 了 使 用 引 号 的 以 保 外 )⃞ 空 白 行 和和 注 释 行 被 视 为 空 行 ⃞ 如 果 已 知<br />

数 据 文 件 中 没 有 注 视 , 那 么 可 以 设 置 comment.char="", 也 许 速 度 会 更 快 ⃞<br />

11⃝Escapes: 很 多 操 作 系 统 中 , 在 文 本 文 件 中 使 用 反 斜 杠 作 为 escape 字 符 , 但 是 Windows<br />

操 作 系 统 中 不 是 如 此 ( 而 是 使 用 反 斜 杠 作 为 文 件 路 径 名 的 一 部 分 )⃞ 在 R 中 是 否 使 用 这 样 的<br />

惯 例 风 格 是 可 选 的 ⃞ 在 read.table 和和 scan 两 个 函 数 中 , 有 一 个 allowEscapes 的 参 数 ⃞ 从 R2.2.0<br />

开 始 , 缺 省 设 置 为 false, 反 斜 杠 被 解 释 为 excape 符 号 ( 在 上 述 情 况 下 )⃞ 如 果 设 置 为 true,<br />

就 解 释 为 C 语 言 风 格 的 escape 字 符 , 称 为 控 制制 字 符 , 可 以 表 示 类 似 \a, \b, \f, \n, \r, \t, \v 以 及<br />

八 进 制制 ⃝ 十 六 进 制制 \040 和和 \0x2A 的 情 况 ⃞<br />

通 用 函 数 read.csv 和和 read.delim 给 read.table 函 数 提 供 了 恰 当 的 参 数 , 用 来 读 取 英 语 情 况<br />

下 的 CSV 和和 制制 表 符 分 割割 文 件 ⃞ 而 read.csv2 和和 read.delim2 函 数 提 供 了 使 用 逗 号 作 为 小 数 点 分<br />

割割 情 况 下 读 取 类 似 文 件 的 功 能 ⃞<br />

如 果 read.table 函 数 中 参 数 设 置 不 正 确 的 时 候 , 出 错 提 示 信 息 通 常 有 如 下 形 式 :<br />

Error in scan(file = file, what = what, sep = sep, :<br />

※† 由 于 本 人 水 平 有 限 , 时 间 仓 促 , 错 误 极 多 , 敬 请 指 出 ⃞ 任 何 意 见 和和 建 议 请 联 系 :pkuabel@126.com

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!