pandas.apply并行化的状态()

在过去的几年中,有几篇文章涉及到pandas.apply()parallelization ,或者是描述可以通过将数据结构化为数据pandas.apply()来解决的问题,以及如果实现了parallelization ,使用pandas.apply()

我向这里的专家们提出这个问题,这个能力的状态是什么, R已经有了这个能力。

目前没有干净的标准解决scheme。 重新编写整个函数和脚本来处理build议的解决方法是非常繁琐的。

Pythonpandas多处理应用

并行化后,pandasgroupby

R中的并行和多核处理

Python多处理pool.map多个参数

在Python中的并行处理

通过multiprocessing.pool.map传递kwargs

传递参数和manager.dict在Python 2.7中的多处理

有没有一个简单的基于进程的python平行映射?

pandas与rpy2和多处理

如何通过Sparkasynchronous地将函数应用于数据框的子集?

高效地将一个函数应用到分组的pandasDataFrame上

python dask DataFrame,支持(trivially parallelizable)row apply?

Python多处理作业Celery任务,但AttributeError

在pandas python中并行化应用函数 在groupby上工作