pandas.apply并行化的状态()
在过去的几年中,有几篇文章涉及到pandas.apply()
的parallelization
,或者是描述可以通过将数据结构化为数据pandas.apply()
来解决的问题,以及如果实现了parallelization
,使用pandas.apply()
。
我向这里的专家们提出这个问题,这个能力的状态是什么, R
已经有了这个能力。
目前没有干净的标准解决scheme。 重新编写整个函数和脚本来处理build议的解决方法是非常繁琐的。
Pythonpandas多处理应用
并行化后,pandasgroupby
R中的并行和多核处理
Python多处理pool.map多个参数
在Python中的并行处理
通过multiprocessing.pool.map传递kwargs
传递参数和manager.dict在Python 2.7中的多处理
有没有一个简单的基于进程的python平行映射?
pandas与rpy2和多处理
如何通过Sparkasynchronous地将函数应用于数据框的子集?
高效地将一个函数应用到分组的pandasDataFrame上
python dask DataFrame,支持(trivially parallelizable)row apply?
Python多处理作业Celery任务,但AttributeError
在pandas python中并行化应用函数 在groupby上工作