有没有办法将dta文件转换为CSV? 我没有Stata的版本,所以我不能做像保存为CSV文件的东西。
我经常碰到这种情况,所以我觉得应该有一个很好的习惯用法。 假设我有一个包含“product”的一系列属性的data.frame。 我也有一个把产品翻译成品牌+尺寸的钥匙。 产品代码1-3是Tylenol,4-6是Advil,7-9是Bayer,10-12是Generic。 什么是最快的(在人的时间方面)来编码呢? 如果有3个或更less的类别,我倾向于使用嵌套的ifelse ,如果有3个或更less的类别,则input数据表并合并。 Stata有一个recode命令 ,对于这样的事情来说非常漂亮,不过我认为它会促进数据代码混合太多。 dat <- structure(list(product = c(11L, 11L, 9L, 9L, 6L, 1L, 11L, 5L, 7L, 11L, 5L, 11L, 4L, 3L, 10L, 7L, 10L, 5L, 9L, 8L)), .Names = "product", row.names = c(NA, -20L), class = "data.frame")
在最近与同学们的交谈中,我一直主张避免使用全局variables,除非存储常量。 这是一种典型的应用统计types的程序,每个人都编写自己的代码,项目规模很小,所以人们很难看到由于习惯不稳而造成的麻烦。 在谈到避免全局variables时,我将重点放在全局variables可能会引起麻烦的以下原因上 ,但是我想在R和/或Stata中有一些例子来遵循这些原则(以及其他您可能认为重要的原则),而我很难想出可信的。 非局域性:全局variables使得debugging变得更加困难,因为他们更难理解代码stream 隐式耦合:全局通过允许遥远的代码段之间的复杂交互来打破函数式编程的简单性 命名空间冲突:通用名(x,i等)被重用,导致命名空间冲突 对这个问题的一个有用的答案将是一个可重复和独立的代码片段,其中全局性导致特定types的麻烦,理想情况下与其中纠正该问题的另一个代码片段。 如果需要,我可以生成更正的解决scheme,所以问题的例子更重要。 相关链接 : 全局variables不好 全局variables是不好的?