Tag: python

python pandas / numpy True / False to 1/0 mapping

我有一个pythonpandasDataFrame具有布尔True / False值的列,但为了进一步计算,我需要1/0表示。 有没有一个快速的pandas/ numpy的方式来做到这一点? 编辑:下面的答案似乎并没有举行的情况下numpy,给定一个数组与整数和True / False值,返回这样的数组dtype=object 。 为了在numpy中继续进行计算,我必须明确地设置np_values = np.array(df.values, dtype = np.float64) 。

在virtualenv中使用pip安装lxml Ubuntu 12.10错误:命令'gcc'失败,退出状态为4

在尝试在Ubuntu 12.10 x64中将“pip install lxml”运行到virtualenv时遇到以下错误。 我有Python 2.7。 我在这里看到了其他相关的问题,并尝试安装python-dev,libxml2-dev和libxslt1-dev。 请从我提示命令到发生错误的那一刻起,查看回溯。 下载/解包lxml 为包lxml运行setup.py egg_info /usr/lib/python2.7/distutils/dist.py:267:UserWarning:Unknown distribution option:'bugtrack_url' warnings.warn(MSG) 构buildlxml版本3.1.2。 没有Cython的build筑。 使用libxslt 1.1.26的构buildconfiguration 在以下目录中针对libxml2 / libxslt构build:/ usr / lib 警告:在目录“src / lxml / tests”下找不到与'* .txt'匹配的文件 安装收集的软件包:lxml 为lxml运行setup.py install /usr/lib/python2.7/distutils/dist.py:267:UserWarning:Unknown distribution option:'bugtrack_url' warnings.warn(MSG) 构buildlxml版本3.1.2。 没有Cython的build筑。 使用libxslt 1.1.26的构buildconfiguration 在以下目录中针对libxml2 / libxslt构build:/ usr / lib 构build“lxml.etree”扩展 gcc -pthread -fno-strict-aliasing -DNDEBUG -g […]

Python技术或纯文本输出的简单模板系统

我正在寻找Python的技术或模板系统格式化输出到简单的文本。 我需要的是,它将能够遍历多个列表或字典。 如果我能够将模板定义到单独的文件(如output.templ)而不是将其硬编码到源代码中,那将会很好。 作为我想达到的简单例子,我们有variablestitle , subtitle和list title = 'foo' subtitle = 'bar' list = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'] 通过模板运行,输出如下所示: Foo Bar Monday Tuesday Wednesday Thursday Friday Saturday Sunday 这个怎么做? 谢谢。

+ =在python中究竟做了什么?

我需要知道python中有什么+ =。 就这么简单。 我也希望能够链接到python中其他短手工具的定义。

Pymysql插入到不工作

我从Eclipse中的PyDev运行这个… import pymysql conn = pymysql.connect(host='localhost', port=3306, user='userid', passwd='password', db='fan') cur = conn.cursor() print "writing to db" cur.execute("INSERT INTO cbs_transactions(leagueID) VALUES ('test val')") print "wrote to db" 结果是,在控制台的顶部显示C:… test.py,在控制台中: 写入数据库写入数据库 所以它不会在执行命令之后终止。 但是当我在MySQL中查看表格时,它是空的。 logging没有被插入。 首先,为什么不写这个logging? 其次,我怎样才能看到一个日志或错误,看看发生了什么。 如果代码失败,通常应该会出现某种红色的错误。

Pythondate时间格式没有零填充

是否有打印Pythondate时间的格式,不会在date和时间使用零填充? 现在使用的格式: mydatetime.strftime('%m/%d/%Y %I:%M%p') 结果: 02/29/2012 05:03 PM 期望: 2012/2/29 5:03 什么格式将月份表示为“2”而不是“02”,时间为“5:03 PM”而不是“05:03PM”

如何在Python中对数组中的唯一值进行计数?

所以我试图让这个程序,将要求用户input并将值存储在数组/列表中。 然后当input一个空白行时,它会告诉用户有多less这些值是唯一的。 我是build立在真实生活的原因,而不是作为一个问题集。 enter: happy enter: rofl enter: happy enter: mpg8 enter: Cpp enter: Cpp enter: There are 4 unique words! 我的代码如下: # ask for input ipta = raw_input("Word: ") # create list uniquewords = [] counter = 0 uniquewords.append(ipta) a = 0 # loop thingy # while loop to ask for input and append […]

为什么'12345'.count('')返回6而不是5?

>>> '12345'.count('') 6 为什么会这样呢? 如果该string中只有5个字符,为什么计数函数返回一个? 另外,有没有一个更有效的方法来计算string中的字符?

MySQL:从查询中获取列名或别名

我不要求SHOW COLUMNS命令。 我想创build一个类似于heidisql的应用程序,您可以在其中指定一个SQL查询,并在执行时返回一个结果集,其中包含表示查询结果的行和列。 结果集中的列名应与您在SQL查询中定义的所选列匹配。 在我的Python程序(使用MySQLdb )中,我的查询只返回行和列结果,而不是列名。 在以下示例中,列名将是ext , totalsize和filecount 。 SQL最终将从程序的外部。 我能想出这个工作的唯一方法是编写我自己的SQLparsing器逻辑来提取选定的列名称。 有没有一种简单的方法来获取所提供的SQL的列名? 接下来,我需要知道查询返回多less列 # Python import MySQLdb #=================================================================== # connect to mysql #=================================================================== try: db = MySQLdb.connect(host="myhost", user="myuser", passwd="mypass",db="mydb") except MySQLdb.Error, e: print "Error %d: %s" % (e.args[0], e.args[1]) sys.exit (1) #=================================================================== # query select from table #=================================================================== cursor = db.cursor () cursor.execute ("""\ […]

pandas.apply并行化的状态()

在过去的几年中,有几篇文章涉及到pandas.apply()的parallelization ,或者是描述可以通过将数据结构化为数据pandas.apply()来解决的问题,以及如果实现了parallelization ,使用pandas.apply() 。 我向这里的专家们提出这个问题,这个能力的状态是什么, R已经有了这个能力。 目前没有干净的标准解决scheme。 重新编写整个函数和脚本来处理build议的解决方法是非常繁琐的。 Pythonpandas多处理应用 并行化后,pandasgroupby R中的并行和多核处理 Python多处理pool.map多个参数 在Python中的并行处理 通过multiprocessing.pool.map传递kwargs 传递参数和manager.dict在Python 2.7中的多处理 有没有一个简单的基于进程的python平行映射? pandas与rpy2和多处理 如何通过Sparkasynchronous地将函数应用于数据框的子集? 高效地将一个函数应用到分组的pandasDataFrame上 python dask DataFrame,支持(trivially parallelizable)row apply? Python多处理作业Celery任务,但AttributeError 在pandas python中并行化应用函数 在groupby上工作