新手上路
前天 13:59
主楼
Awesome R
2023
2020
- VSCode - vscode-R + vscode-r-lsp VSCode R 语言支持
- gt - 轻松生成信息丰富、出版质量的表格
- lightgbm - Light Gradient Boosting Machine.
- torch - Tensors and Neural Networks with 'GPU' Acceleration.
2019
集成开发环境
集成开发环境- VSCode - vscode-R + vscode-r-lsp VSCode R 语言支持
- RStudio - R 的强大且高效的用户界面。在 Windows、Mac 和 Linux 上运行良好。
- Emacs + ESS - Emacs Speaks Statistics 是 Emacs 文本编辑器的一个插件包。
- Sublime Text + R-IDE - Sublime Text 2/3 的插件包。
- TextMate + r.tmblundle - TextMate 1/2 的插件包。
- StatET - 基于 Eclipse 的 R 语言 IDE。
- R Commander - 一个提供基本图形用户界面的软件包。
- IRkernel - Jupyter 的 R 语言内核。
- Deducer - 一个菜单驱动的数据分析 GUI,带有类似电子表格的数据编辑器。
- Radiant - 基于 Shiny 的跨平台浏览器端 R 商业分析界面。
- Nvim-R - R 的 Neovim 插件。
- Jamovi 和JASP - 适用于贝叶斯和频率方法的桌面软件,界面类似 SPSS 用户。
- Bio7 - 包含模型创建、科学图像分析和生态模型统计分析工具的 IDE。
- RTVS - R Tools for Visual Studio.
- radian (前身为 rtichoke) - 一个现代的 R 控制台,支持语法高亮。
- RKWard - 一个可扩展的 R IDE/GUI。
语法
包改变了你使用 R 的方式。- magrittr - 让我们使用管道。
- pipeR - 多范式管道实现。
- lambda.r - R 中的函数编程和简单的模式匹配。
- purrr - R 语言中的函数式编程包,灵感来自 underscore.js。
数据操作
用于数据处理的包。- dplyr - 快速的数据框操作和数据库查询。
- data.table - 短小灵活的语法实现快速数据操作。
- reshape2 - 灵活地重新排列、重塑和聚合数据。
- tidyr - 使用 spread 和 gather 函数轻松整理数据。
- broom - 将统计分析对象转换为整洁的数据帧。
- rlist - 用于非表格数据列表操作的工具箱。
- ff - 用于存储大型数据集的数据结构。
- lubridate - 一套用于处理日期和时间的函数。
- stringi - 基于 ICU 的字符串处理包。
- stringr - 一致性的字符串处理 API,基于 stringi 构建。
- bigmemory - 共享内存和内存映射矩阵。big*包提供额外工具,包括线性模型(biglm)和随机森林(bigrf)。
- fuzzyjoin - 基于近似匹配将表格连接在一起。
- tidyverse - 轻松安装和加载 tidyverse 包。
- snakecase - 自动解析并转换字符串为蛇形或驼峰等格式。
- DataExplorer - 最少代码快速探索数据分析。
数据格式
用于读取和写入不同格式数据的软件包。- arrow - Arrow C++库的接口。
- feather - 由 Apache Arrow 支持,为 Python、R 等提供快速、可互操作的二进制数据帧存储。
- fst - R 语言中数据帧的闪电般快速序列化。
- haven - R 语言中改进的 SPSS、Stata 和 SAS 文件导入方法。
- jsonlite - 一种在 R 中解析 JSON 文件的稳健且快速的方法。
- qs - 快速序列化 R 对象。
- readxl - 将 Excel 文件(.xls 和.xlsx)读取到 R 中。
- readr - 一种快速且友好的方法,用于将表格数据读取到 R 中。
- rio - 一个瑞士军刀式的数据输入输出工具。
- readODS - 将 OpenDocument 电子表格读取为 R 中的 data.frame。
- RcppTOML - Rcpp 与 C++ TOML 文件解析器的绑定。
- vroom - 快速读取分隔符文件。
- writexl - R 语言的便携式、轻量级数据框到 xlsx 导出器。
- yaml - R 包,用于在对象和 YAML 之间进行转换。
图形显示
显示数据的软件包。- ggplot2 - 图形语法(Grammar of Graphics)的实现。
- ggfortify - 使用一行代码统一调用 ggplot2 的流行统计包的接口。
- ggrepel - 将重叠的文本标签相互推远。
- ggalt - 为 ggplot2 提供额外的坐标系统、几何图形和统计转换。
- ggstatsplot - 基于 ggplot2 的带统计详情的绘图
- ggtree - 系统发育树的可视化和注释。
- ggtech - ggplot2 技术主题和尺度
- ggplot2 Extensions - ggplot2 扩展的展示。
- lattice - 一个强大而优雅的高级数据可视化系统。
- corrplot - 用于显示相关矩阵或一般矩阵的图形工具。它还包含一些用于矩阵重排序的算法。
- rgl - R 语言的 3D 可视化设备系统。
- Cairo - 使用 cairo 图形库创建高质量显示输出的 R 图形设备。
- extrafont - 用于在 R 图形中使用字体的工具。
- showtext - 使 R 图形设备能够使用系统字体显示文本。
- animation - 一种简单的方法,用于在 R 中生成动画图形,使用 ImageMagick。
- gganimate - 使用 ggplot2 轻松创建动画。
- misc3d - 用于处理 3d 图形、等值面等的强大函数。
- xkcd - 在图形中使用 xkcd 风格。
- imager - 基于 CImg 库的图像处理包,用于处理图像并显示它们。
- hrbrthemes - 🔏 基于类型排印的 ggplot2 主题和主题组件。
- waffle - 🍁 在 R 中制作 waffle(方形派)图表。
- dendextend - 可视化、调整和比较层次聚类树。
- idendro - 交互式探索树状图(层次聚类树)。
- r2d3 - R 接口到 D3 可视化。
- Patchwork - 将多个 ggplots 组合到同一个图形中。
- plot3D - 绘制多维数据。
- plot3Drgl - 绘制多维数据 - 使用'rgl'。
- httpgd - R 的异步 http 服务器图形设备。
HTML 小部件
交互式可视化包。- heatmaply - 使用 D3 的交互式热图。
- d3heatmap - 使用 D3 的交互式热图(已不再维护)。
- DataTables - 将 R 矩阵或数据框显示为交互式 HTML 表格。
- DiagrammeR - 在 R 中创建 JS 图形图表和流程图。
- dygraphs - 在 R 中绘制时间序列数据图表。
- formattable - 可格式化数据结构。
- ggvis - R 语言的交互式图形语法。
- Leaflet - 最受欢迎的 JavaScript 库之一,用于交互式地图。
- MetricsGraphics - 便于创建 D3 散点图、折线图和直方图。
- networkD3 - 从 R 创建 D3 JavaScript 网络图。
- scatterD3 - 使用 D3 创建交互式散点图。
- plotly - 使用plot.ly进行交互式 ggplot2 和 Shiny 绘图。
- rCharts - 从 R 创建交互式 JS 图表。
- rbokeh - Bokeh的 R 接口。
- threejs - 交互式 3D 散点图和地球仪。
- timevis - 创建完全交互式的时间线可视化。
- visNetwork - 使用 vis.js 库进行网络可视化。
- wordcloud2 - wordcloud2.js 的 R 接口。
- highcharter - 基于 htmlwidgets 的 highcharts R 包装器
- echarts4r - Echarts 版本 4 的 R 包装器
可复现研究
- 用于 literate programming 和可复现工作流的软件包。
- knitr - 在 R 中轻松生成动态报告。
- redoc - 可逆可重复文档
- tinytex - 轻量级且易于维护的 LaTeX 发行版
- xtable - 将表格导出到 LaTeX 或 HTML。
- rapport - 一个 R 模板系统。
- rmarkdown - R 的动态文档。
- slidify - 从 R markdown 生成可重复的 html5 幻灯片。
- Sweave - 一个设计用来用 R 编写 LaTeX 报告的软件包。
- texreg - 在 LaTeX 和 HTML 中格式化统计模型。
- checkpoint - 从检查点服务器上的快照安装软件包。
- brew - 预计算数据以增强您的报告模板。可以与 knitr 结合使用。
- officer - 一个用于生成 Microsoft Word、Microsoft PowerPoint 和 HTML 报告的 R 软件包。
- flextable - 一个 R 包,用于在 Microsoft Word、Microsoft PowerPoint 和 HTML 报告中嵌入复杂表格(合并单元格、多级标题和页脚、条件格式)。它与[officer]包合作,并与[rmarkdown]报告集成。
- bookdown - 使用 R Markdown 编写书籍。
- ezknitr - 避免在使用'knitr'时遇到典型的当前工作目录问题。
- targets - 类似于 Make 的管道工具,用于组织和运行数据科学工作流,自动跳过已经完成的步骤。由rOpenSci支持。
- R Suite - 一个用于设计灵活且可重复的 R 部署工作流的软件包。
- kable - 使用 'knitr' 的 'kable()' 构建 HTML 或 'LaTeX' 表格。
Web 技术和服务
- 浏览网络的软件包。
- Web Technologies List - 关于如何将 R 与万维网结合使用的信息。
- shiny - 使用 R 轻松创建交互式网络应用程序。另见 awesome-rshiny
- shinyjs - 在几秒钟内轻松提升您的 Shiny 应用程序的用户交互和用户体验。
- RCurl - R 的通用网络(HTTP/FTP/...)客户端接口。
- curl - R 语言的现代且灵活的 Web 客户端
- httr - 用户友好的 RCurl 包装器。
- httpuv - HTTP 和 WebSocket 服务器库。
- XML - 用于在 R 中解析和生成 XML 的工具。
- xml2 - 专为 R 语言优化的 XML 解析和生成工具。
- rvest - R 语言的简单网页抓取工具,支持 CSSSelect 或 XPath 语法。
- OpenCPU - 基于 Apache2 Web 服务器的 R 语言 HTTP API,处理并发调用,将 R 代码作为 REST Web 服务公开,并创建完整的、多页面的 Web 应用程序。
- Rfacebook - 通过 R 语言访问 Facebook API。
- RSiteCatalyst - Adobe Analytics 的 R 客户端库。
- plumber - 一个将现有 R 代码作为 Web API 暴露的库。
- golem - 一个用于构建生产级 Shiny 应用的框架。
并行计算
并行计算软件包。- parallel - R 从 2.14.0 版本开始引入了新的软件包 parallel,其中包含了多核和snow软件包的(略作修订的)副本。
- Rmpi - Rmpi 提供了一个 MPI API 的接口(包装器)。它还提供了一个交互式 R 从属环境。
- foreach - 并行执行循环。
- future - 一个极简、高效、跨平台的统一 Future API,用于 R 语言的并行和分布式处理;专为初学者和高级开发者设计。
- SparkR - Spark 的 R 语言前端。
- DistributedR - 来自 HP Vertica Analytics 团队的、可扩展的高性能平台。
- ddR - 提供分布式数据结构,简化 R 语言的分布式计算。
- sparklyr - RStudio 提供的 Apache Spark 的 R 接口。
- batchtools - 支持 LSF、TORQUE、Slurm、OpenLava、SGE 和 Docker Swarm 的高性能计算。
高性能
用于使 R 运行更快的软件包。- Rcpp - Rcpp 在 R 之上提供了一个强大的 API,使 R 中的函数运行速度极快。
- Rcpp11 - Rcpp11 是 Rcpp 的完全重新设计,目标是 C++11。
- compiler - 使用 JIT 加速你的 R 代码。
- cpp11 - cpp11 是一个纯头文件的 R 包,帮助 R 包开发者使用 C++代码处理 R 对象。它与 Rcpp 类似,但具有不同的设计权衡和特性。
语言 API
其他语言的包。- rJava - 低级 R 到 Java 接口。
- jvmr - R、Java 和 Scala 的集成。
- reticulate - Python 接口。
- rJython - 通过 Jython 实现 R 对 Python 的接口。
- rPython - 允许 R 调用 Python 的包。
- runr - 从 R 运行 Julia 和 Bash。
- RJulia - R 包调用 Julia。
- JuliaCall - R 与 Julia 的无缝集成。
- RinRuby - 一个在 Ruby 中集成 R 解释器的 Ruby 库。
- R.matlab - 读取和写入 MAT 文件,以及 R 到 MATLAB 的连接。
- RcppOctave - 无缝接口到 Octave 和 Matlab。
- RSPerl - 双向接口,用于从 Perl 调用 R 和从 R 调用 Perl。
- V8 - 嵌入式 JavaScript 引擎。
- htmlwidgets - 将 JavaScript 数据可视化的最佳功能带到 R 中。
- rpy2 - Python 接口用于 R。
数据库管理
用于管理数据的包。- RODBC - R 的 ODBC 数据库访问。
- DBI - 定义了 R 和数据库管理系统之间的通用接口。
- elastic - Elasticsearch HTTP API 的包装器
- mongolite - R 的流式 Mongo 客户端
- odbc - 连接到 ODBC 数据库(使用 DBI 接口)
- RMariaDB - 一个用于 MariaDB 的 R 接口(替代旧的 RMySQL 包)
- RMySQL - 用于 MySQL 数据库的 R 接口。
- ROracle - 基于 OCI 的 R 用 Oracle 数据库接口。
- RPostgres - 一个符合 DBI 规范的 postgres 数据库接口。
- RPostgreSQL - R 接口到 PostgreSQL 数据库系统。
- RSQLite - R 的 SQLite 接口
- RJDBC - 通过 JDBC 接口提供数据库访问。
- rmongodb - R 的 MongoDB 驱动程序。
- redux - R 的 Redis 客户端
- RCassandra - 直接接口(非 Java)到 Apache Cassandra 最基本的功能
- RHive - 通过 Apache Hive 促进分布式计算的 R 扩展
- RNeo4j - Neo4j 图数据库驱动器
- rpostgis - R 接口到 PostGIS 数据库并在 R 中获取空间对象。
机器学习
用于使 R 更智能的包。- anomalize - 使用 Twitter 的 AnomalyDetection 方法进行整洁的异常检测。
- AnomalyDetection - 来自 Twitter 的 AnomalyDetection R 包。
- ahaz - 半参数加性风险回归的正则化。
- arules - 挖掘关联规则和频繁项集。
- bigrf - 大型随机森林:用于分类和回归的森林。
- bigRR - 广义岭回归(对于 p >> n 特别有利)
- bmrm - 正则化风险最小化的捆绑方法包
- Boruta - 所有相关特征选择的包装算法
- BreakoutDetection - 来自 Twitter 的鲁棒 E 统计的突破检测
- bst - 梯度提升
- CausalImpact - 使用贝叶斯结构时间序列模型的因果推断
- C50 - C5.0 决策树和基于规则的模型
- caret - 分类和回归训练
- Clever Algorithms For Machine Learning
- CORElearn - 分类、回归、特征评估和有序
- CoxBoost - 基于似然提升的单个生存 Cox 模型
- Cubist - 基于规则和实例的回归建模
- e1071 - 统计系(e1071)的杂项函数,维也纳理工大学
- earth - 多元自适应回归样条模型
- elasticnet - 用于稀疏估计和稀疏主成分的弹性网络
- ElemStatLearn - 来自书籍《The Elements》的数据集、函数和示例
预测" 作者 Trevor Hastie、Robert Tibshirani 和 Jerome
Friedman
- evtree - 全局最优树的进化学习
- fable - 常用单变量和多变量时间序列预测模型的集合
- prophet - 用于生成具有多个季节性和线性或非线性增长的时间序列数据的高质量预测的工具。
- FSelector - 基于子集搜索或特征排序方法的特征选择框架。
- frbs - 用于分类和回归任务的模糊规则系统。
- GAMBoost - 基于似然估计的广义线性与加性模型
- gamboostLSS - GAMLSS 的 Boosting 方法
- gbm - 广义提升回归模型
- glmnet - Lasso 和弹性网络正则化的广义线性模型
- glmpath - 广义线性模型和 Cox 比例风险模型的 L1 正则化路径
协变量
- h2o - 深度学习,随机森林,GBM,KMeans,PCA,GLM
- hda - 异方差判别分析
- ipred - 改进预测器
- kernlab - kernlab: 基于核的机器学习实验室
- klaR - 分类和可视化
- kohonen - 监督和非监督自组织映射。
- L0Learn - 快速算法用于最佳子集选择
- lars - 最小角度回归、Lasso 和前向逐步回归
- lasso2 - L1 约束估计,即“lasso”
- LiblineaR - 基于 Liblinear C/C++库的线性预测模型
- lightgbm - 轻量级梯度提升机。
- lme4 - 混合效应模型
- nlme - 混合效应模型,处理用户指定的残差协方差矩阵,适用于纵向试验中重复观测值的分析
- glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,适用于纵向试验中重复观测数据的分析
- LogicReg - 逻辑回归
- maptree - 树模型的映射、剪枝和绘图
- mboost - 基于模型的提升
- 机器学习黑客
- mlr - 可扩展的分类、回归、生存分析和聚类框架 [已弃用]
- mlr3 - 新一代可扩展的分类、回归、生存分析和聚类框架
- mvpart - 多元划分
- MXNet - MXNet 为 R 带来了灵活高效的 GPU 计算和最先进的深度学习。
- ncvreg - SCAD-和 MCP 惩罚回归的正则化路径
- nnet - 前馈神经网络和多类逻辑回归模型
- oblique.tree - 用于分类数据的斜切树
- pamr - Pam:微阵列预测分析
- party - 递归分区实验室
- partykit - 递归分区工具包
- penalized - L1(lasso 和 fused lasso)和 L2(ridge)惩罚估计
- penalizedLDA - 使用 Fisher 线性判别进行惩罚分类
- penalizedSVM - 使用惩罚函数的特征选择 SVM
- quantregForest - quantregForest: 分位数回归森林
- randomForest - randomForest: Breiman 和 Cutler 的用于分类和回归的随机森林
- randomForestSRC - randomForestSRC: 用于生存分析、回归和分类的随机森林(RF-SRC)
- ranger - 随机森林的快速实现
- rattle - R 中的数据挖掘图形用户界面。
- rda - 压缩质心正则化判别分析
- rdetools - 特征空间中的相关维度估计(RDE)
- REEMtree - 长期(面板)随机效应回归树
- relaxo - 松弛 Lasso
- rgenoud - 基于导数的遗传优化 R 版本
- rgp - R 遗传编程框架
- Rmalschains - 使用元启发式算法进行连续优化
- rminer - 更简单的使用数据挖掘方法(例如 NN 和 SVM)
- ROCR - 可视化评分分类器的性能
- RoughSets - 基于粗糙集和模糊粗糙集理论的数据分析
- rpart - 递归分割和回归树
- RPMM - 递归分割混合模型
- RSNNS - 使用 Stuttgart 神经网络在 R 中进行神经网络
角度回归
- sda - 收缩判别分析和 CAT 得分变量选择
- SDDA - 逐步对角判别分析
- SuperLearner 和 subsemble - 多算法集成学习包。
- survminer - 生存分析与可视化
- survival - 生存分析
- svmpath - svmpath:支持向量机路径算法
- tgp - 贝叶斯树状高斯过程模型
- tidymodels - 一系列共享 tidyverse 底层设计理念、语法和数据结构的建模和统计分析包。
- torch - 带有 'GPU' 加速的张量和神经网络。
- tree - 分类和回归树
- varSelRF - 使用随机森林进行变量选择
- xgboost - eXtreme Gradient Boosting Tree 模型,以其速度和性能而闻名。
自然语言处理
自然语言处理包- text2vec - 快速文本挖掘框架,用于向量化及词嵌入。
- tm - R 语言的全面文本挖掘框架。
- openNLP - Apache OpenNLP 工具接口。
- koRpus - 用于文本分析的 R 包。
- zipfR - 用于词频分布的统计模型。
- NLP - 自然语言处理的基本功能。
- LDAvis - 主题模型的交互式可视化。
- topicmodels - 主题建模接口,用于 David M. Blei 开发的 C 代码,用于主题建模(潜在狄利克雷分配(LDA)和相关主题模型(CTM))。
- syuzhet - 使用三种不同的情感词典从文本中提取情感。
- SnowballC - 基于 C 语言 libstemmer UTF-8 库的 Snowball 词干提取器。
- quanteda - R 语言文本数据分析函数。
- 主题模型资源 - 主题模型学习和 R 相关资源。
- R 中的 NLP 资源 - R 中的 NLP 相关资源。@中文
- MonkeyLearn - 🐒 使用 Monkeylearn 进行文本分析的 R 包 🐒。
- tidytext - 将 Hadley Wickham 的整洁原则应用于文本挖掘。
- utf8 - 操作和打印 UTF-8 文本,修复 R 中 UTF-8 处理的多个错误。
- corporaexplorer - 动态探索文本集合
贝叶斯
贝叶斯推断软件包。- brms - 使用 Stan 的贝叶斯回归模型的高级接口。
- coda - 输出分析和诊断 MCMC。
- mcmc - 马尔可夫链蒙特卡洛
- MCMCpack - 马尔可夫链蒙特卡洛 (MCMC) 软件包。
- R2WinBUGS - 从 R/S-PLUS 运行 WinBUGS 和 OpenBUGS。
- BRugs - R 接口到 OpenBUGS MCMC 软件。
- rjags - R 接口到 JAGS MCMC 库。
- rstan - R 接口到 Stan MCMC 软件。
优化
用于优化的软件包。- lpSolve -
Lp_solve的接口,用于求解线性/整数规划问题。 - minqa - 通过二次近似实现的无导数优化算法。
- nloptr - NLopt 是一个用于非线性优化的免费/开源库。
- ompr - 直接在 R 中以代数方式建模混合整数线性规划。
- Rglpk - R/GNU 线性规划工具包接口
- ROI - R 优化基础设施('ROI')是一个用于处理 R 中优化问题的复杂框架。
金融
处理金钱的软件包。- quantmod - R 语言的量化金融建模与交易框架。
- pedquant - 公共经济数据与定量分析
- TTR - 用 R 构建技术交易规则的函数和数据。
- PerformanceAnalytics - 绩效与风险分析的计量经济学工具。
- zoo - 规则与不规则时间序列的 S3 基础设施。
- xts - 可扩展时间序列。
- tseries - 时间序列分析与计算金融。
- fAssets - 分析和建模金融资产。
- scorecard - 信用风险评分卡
生物信息学与生物统计学
用于处理生物数据集的软件包。- Bioconductor - 用于分析和理解高通量基因组数据的工具。
- genetics - 用于处理遗传数据的类和方法。
- gap - 用于分析群体和家族遗传数据的集成包。
- ape - 系统发育和进化的分析。
- pheatmap - 轻松制作美观热图。
- lme4 - 广义混合效应模型。
- nlme - 混合效应模型,处理用户指定的残差协方差矩阵,适用于纵向试验中重复观测的分析。
- glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,适用于纵向试验中重复观测的分析。
网络分析
用于构建、分析和可视化网络数据的软件包。网络分析资源列表 - 与网络分析相关的资源。
- CRAN 任务视图网络分析 - 关于网络分析资源的 CRAN 任务视图。
- igraph - 一套网络分析工具。
- network - R 中处理关系数据的基本工具。
- sna - 基本网络测量和可视化工具。
- manynet - 用于创建和修改多种不同类型网络的工具。
- autograph - 自动绘制网络图和模型的工具。
- netdiffuseR - 用于网络扩散分析的工具。
- networkDynamic - 支持动态、(跨)时间网络。
- ndtv - 用于构建多种格式动态网络数据动画可视化的工具。
- statnet - 许多 R 网络分析软件包背后的项目。
- ergm - R 中的指数随机图模型。
- latentnet - 用于网络对象的潜在位置和聚类模型。
- tnet - 用于加权、双模式和纵向网络的网络度量。
- rgexf - 从 R 导出网络对象到GEXF,用于使用网络软件如Gephi或Sigma进行操作。
- visNetwork - 使用 vis.js 库进行网络可视化。
- tidygraph - 图形操作的整洁 API
空间
探索地球的软件包。- CRAN 任务视图:空间数据分析 - 与空间分析相关的资源。
- Leaflet - 最受欢迎的交互式地图 JavaScript 库之一。
- ggmap - 使用 ggplot2 在 R 中绘制地图。
- REmap - R 接口到 JavaScript 库 ECharts,用于交互式地图数据可视化。
- sf - 空间数据改进的类和方法。
- sp - 空间数据的类和方法。
- rgeos - 几何引擎-开源的接口。
- rgdal - 地理空间数据抽象库的绑定
- maptools - 用于读取和处理空间对象的工具
- gstat - 空间和时空地质统计建模、预测和模拟。
- spacetime - R 类和方法,用于时空数据。
- RColorBrewer - 提供地图的颜色方案
- spatstat - 空间点模式分析、模型拟合、模拟、检验
- spdep - 空间依赖性:加权方案、统计和模型
- tigris - 在 R 中下载和使用人口普查 TIGER/Line 形状文件
- GWmodel - 地区加权模型
- tmap - 主题地图 R 包
R 开发
包中的包。- 包开发列表 - 用于改进包开发的 R 包。
- promises - 基于 Promise 的异步编程抽象。
- devtools - 使 R 开发者的生活更轻松的工具。
- testthat - 使测试变得有趣的 R 包。
- R6 - R 内置类更简单、更快、更轻量级的替代方案。
- pryr - 让 R 中的情况更容易理解。
- roxygen - 在函数定义旁边的注释中描述你的函数。
- lineprof - 在 R 中可视化行级分析结果。
- renv - 让你的 R 项目更加隔离、便携和可重复。
- installr - 用于从 R 中安装软件(适用于 Windows)的函数。
- import - R 语言的导入机制。
- box - R 语言的现代模块系统。
- Rocker - Docker的 R 配置。
- RStudio 插件 - RStudio 插件列表。
- drat - 创建和使用 GitHub 或其他仓库上的 R 仓库。
- covr - 用于您的 R 包的测试覆盖率,并(可选地)将结果上传到 coveralls 或 codecov。
- lintr - 静态代码分析工具,用于 R 语言以强制代码风格。
- staticdocs - 生成 R 包的静态 HTML 文档。
- sinew - 生成填充了从函数脚本中抓取信息的 roxygen2 骨架。
日志记录
日志记录包- futile.logger - 一个类似于 log4j 的 R 语言日志记录包
- log4r - R 语言的 log4j 衍生包
- logging - 一个模仿 python 日志记录包的日志记录包
数据包
实用数据包- engsoccerdata - 英格兰和欧洲足球比赛结果 1871-2016 年。
- gapminder - Gapminder 数据集的摘录(关于过去 50 年国家数据)。
- wbstats - 用于从世界银行数据 API 和世界银行数据目录 API 搜索和下载数据和统计的工具。
- ICON - 来自复杂网络索引(ICON)数据库的复杂系统与网络数据集 网页。
- RCOBOLDI - 直接将 COBOL CopyBook 数据文件导入 R 作为结构良好的数据框。软件包构建可通过 Drat 和 DockerHub 获取。
其他工具
R 的实用工具其他解释器
备用 R 引擎。- CXXR - 将 R 重构为 C++。
- fastR - FastR 是建立在 Truffle 和 Graal 之上的 R 语言实现。
- pqR - 一个"快速"的 R 实现
- renjin - 基于 JVM 的 R 解释器。
- rho - 将 R 语言的解释器重构为一个完全兼容、高效的 R 虚拟机。
- riposte - 一个用于 R 语言的快速解释器和 JIT。
- TERR - TIBCO Enterprise Runtime for R.
学习 R
学习 R 的包。- swirl - 直接在你的 R 控制台中进行的交互式 R 教程。
- DataScienceR - 数据科学、NLP 和机器学习的 R 教程列表。
资源
如何发现新的资源。网站
手册
- R-project - 统计计算 R 项目。
- An Introduction to R - 关于 R 的非常优秀的入门文本,也涵盖了一些高级主题。另见CRAN上的
Manuals部分。 - CRAN Contributed Docs - 多种语言的 CRAN 贡献文档。
- Quick-R - 优秀的快速参考指南
- tryR - 一个快速入门 R 的课程。
工具和参考资料
- RDocumentation - 通过 RDocumentation 搜索所有 CRAN、Bioconductor、Github 包及其存档。
- rdrr.io - 查找 R 包文档。在浏览器中尝试 R 包。
- CRAN 任务视图 - CRAN 包的任务视图。
- rnotebook.io - 免费创建在线 R Jupyter Notebooks。
新闻和信息
- R Weekly - 关于 R 和数据科学的每周更新。R Weekly 在 GitHub 上公开开发。
- R Bloggers - 网络上散布着许多撰写关于 R 博客的人。这只是一个聚合了许多这些源的工具。
- R-users - 一个面向 R 用户(以及希望雇佣他们的公司)的招聘平台
书籍
免费,在线
- _R 语言数据科学_ by Garrett Grolemund & Hadley Wickham - RStudio 开发者提供的免费书籍,重点介绍数据科学工作流程。
- _R 编程 cookbook_ by Winston Chang - 面向问题的在线书籍,支持其《R 图形编程 cookbook(第二版,2018)》。
- _高级 R 语言_,第二版 by Hadley Wickham (2019) - 《高级 R 语言》的在线版本。
- _R 包_,第二版 by Hadley Wickham & Jennifer Bryan - 关于编写 R 包的书籍(纸质版和网站版)。
- 作为约翰霍普金斯大学数据科学专业一部分编写的书籍:
- 《用 R 进行探索性数据分析》(Roger D. Peng,2016)链接 - 在 R 中对各种数据的基本分析技能。
- 《R 语言数据科学编程》(Roger D. Peng,2019)链接 - 依赖 R 编程的更高级数据分析。
- 《R 语言数据科学报告写作》(Roger D. Peng,2019)链接 - 基于 R 的可重复研究方法和报告生成。
- _R for SAS 和 SPSS 用户_ by Bob Muenchen (2012) - 对于已经熟悉 SAS 或 SPSS 的用户来说,这是一个极好的资源。
- _用 R 进行统计学习入门_ by Gareth James 等 (2017) - *统计学习基础*的简化和"操作化"版本。作者免费提供软拷贝。
- _R 地狱_ by Patrick Burns (2011) - Patrick Burns 深入剖析了 R 的方方面面及其怪癖!
- _高效 R 编程_ by Colin Gillespie & Robin Lovelace (2017) - O'Reilly 书籍《高效 R 编程》的在线版本。
- R 编程维基教科书 - 一个关于 R 的合作式手册。
付费
- 《R 的艺术》 - 它是一个系统地学习对象类型、控制语句、变量作用域、类和调试等基础知识的良好资源。
- 《R 配方指南》,第二版,由 JD Long & Paul Teetor (2019)编写 - 快速简单地介绍如何使用 R 执行许多常见的统计任务。
- R in Action - 这本书面向所有级别的用户,包含从"探索 R 数据结构"到运行回归和进行因子分析的初级、中级和高级 R 部分。
- _Use R!_ 系列 by Springer - 这是由 Springer 出版的经济实惠且专注的书籍系列,面向实践者。书籍可以讨论 R 在特定主题领域的使用,例如贝叶斯网络、ggplot2 和 Rcpp。
- Learning R Programming - 从基础知识到高级主题,学习 R 作为编程语言。
书籍/专题著作列表和评论
- R 图书列表 - R 图书列表。
- 应用数据科学阅读材料 - 这些阅读材料反映了 Hadley 对应用数据科学的个人思考。
播客
- 不太标准的偏差 - 数据科学播客。
- @Roger Peng 和 @Hilary Parker.
- R World News - R World News 帮助你了解 R 社区的最新动态。
- @Bob Rudis 和 @Jay Jacobs.
- The R-Podcast - 提供关于如何使用 R 的实用建议。
- @Eric Nantz .
- R Talk - 统计软件和语言 R 的新闻和讨论。
- @Oliver Keyes , @Jasmine Dumas, @Ted Hart 和 @Mikhail Popov.
- R Weekly - 关于 R 社区的每周新闻更新。
参考卡片
- RStudio 抄袭表
- R 参考卡片 2.0 - 来自《R 入门》的材料,经 Emmanuel Paradis 授权(版本 2 由 Matt Baggott 制作)。
- 回归分析参考卡片 - R 回归分析参考卡片。
- ESS 参考卡片 - ESS 参考卡片。
MOOCs
大规模开放在线课程。- 约翰霍普金斯大学数据科学专项课程 - 包括 9 门课程:R 语言入门、可读性分析工具、Shiny 及其他课程。
- HarvardX 生物医学数据科学 - 生命科学中的 R 语言入门。
- 用 R 探索统计学 - 涵盖 R 语言中的入门、数据处理和统计分析。
列表
学习领域知识的优质资源.- 书籍 - R 书籍列表。
- ggplot2 扩展 - ggplot2 扩展的展示。
- 自然语言处理 - R 中的自然语言处理相关资源。@Chinese
- 网络分析 - 网络分析相关资源。
- 开放数据 - 使用 R 获取、解析、操作、创建和共享开放数据。
- 文章 - 优秀的 R 博客文章或 R 文章。
- 包开发 - 改进包开发的 R 包。
- R 项目会议 - 关于 useR!会议和 DSC 会议的信息。
- RStartHere - 一份关于最有用的 R 包的指南,按工作流程组织。
- RStudio Addins - RStudio 插件列表。
- Topic Models - 主题模型学习和 R 相关资源。
- Web Technologies - 关于如何将 R 与世界 Wide Web 结合使用的信息。
R 生态系统
R 社区和软件包集合(按字母顺序排列):- rOpenGov 开放政府数据、计算社会科学、数字人文
- rOpenHealth 公共卫生数据
- rOpenSci 开放科学
2018
- fable - 单变量和多变量时间序列预测模型
- r2d3 - R 接口到 D3 可视化
- rstats-ed - 教授 R 的课程列表
- promises - 基于 Promise 的异步编程抽象
- tinytex - 轻量级且易于维护的 LaTeX 发行版
- Readings in Applied Data Science - 这些阅读材料反映了 Hadley 对应用数据科学的个人思考。
2017
- prophet - 用于生成具有多个季节性和线性或非线性增长的时间序列数据的高质量预测工具。
- tidyverse - 轻松安装和加载 tidyverse 包
- purrr - R 语言的函数式编程工具包
- hrbrthemes - 🔏 主观性、以排版为中心的 ggplot2 主题和主题组件
- xaringan - 使用 R Markdown 和 JavaScript 库创建 HTML5 幻灯片
- blogdown - 使用 R Markdown 创建博客和网站
- glue - 在 R 中将字符串连接到数据。小型、快速、无依赖的交互式字符串字面量。
- covr - R 的测试覆盖率报告
- lintr - R 的静态代码分析
- reprex - 用于分享 R 代码片段,例如在 GitHub 或 StackOverflow 上。
- reticulate - R 语言对 Python 的接口
- tensorflow - R 语言中的 TensorFlow
- utf8 - 操作和打印 UTF-8 文本,修复了 R 中 UTF-8 处理中的多个错误。
- Patchwork - 将多个 ggplots 组合到同一个图形中。