pyyaml:倾销没有标签

我有

>>> import yaml >>> yaml.dump(u'abc') "!!python/unicode 'abc'\n" 

但我想要

 >>> import yaml >>> yaml.dump(u'abc', magic='something') 'abc\n' 

什么魔法param力量没有标签?

您可以使用safe_dump而不是dump 。 只要记住它不能代表任意的Python对象。 另外,当你load YAML时,你会得到一个str对象而不是unicode

这个怎么样:

 def unicode_representer(dumper, uni): node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni) return node yaml.add_representer(unicode, unicode_representer) 

这似乎使转储unicode对象工作相同的转储str对象为我(Python 2.6)。

 In [72]: yaml.dump(u'abc') Out[72]: 'abc\n...\n' In [73]: yaml.dump('abc') Out[73]: 'abc\n...\n' In [75]: yaml.dump(['abc']) Out[75]: '[abc]\n' In [76]: yaml.dump([u'abc']) Out[76]: '[abc]\n' 

您需要一个新的自卸车类,完成标准自卸车类的所有工作,但是会覆盖str和unicode的代表。

 from yaml.dumper import Dumper from yaml.representer import SafeRepresenter class KludgeDumper(Dumper): pass KludgeDumper.add_representer(str, SafeRepresenter.represent_str) KludgeDumper.add_representer(unicode, SafeRepresenter.represent_unicode) 

这导致

 >>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper) [abc, "abc\xE7"] >>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None) [abc, "abc\xE7"] 

当然,我仍然难以保持这个漂亮。

 >>> print u'abc\xe7' abcç 

它打破了以后yaml.load()

 >>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None)) >>> yy ['abc', 'abc\xe7'] >>> print yy[1] abc  >>> print u'abc\xe7' abcç 

除了interjay的优秀答案,你可以保持你的unicode重新加载,如果你照顾你的文件编码。

 # -*- coding: utf-8 -*- import yaml import codecs data = dict(key = u"abcç\U0001F511") fn = "test2.yaml" with codecs.open(fn, "w", encoding="utf-8") as fo: yaml.safe_dump(data, fo) with codecs.open(fn, encoding="utf-8") as fi: data2 = yaml.safe_load(fi) print ("data2:", data2, "type(data.key):", type(data2.get("key")) ) print data2.get("key") 

test2.yaml内容在我的编辑器中:

{key: "abc\xE7\uD83D\uDD11"}

打印输出:

('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>) abcç🔑

另外,阅读http://nedbatchelder.com/blog/201302/war_is_peace.html后,我很确定safe_load / safe_dump是我想要的地方。

我刚刚开始使用Python和YAML,但可能这也可能有帮助。 只比较输出:

 def test_dump(self): print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True) print yaml.dump_all([{'name': 'value'}, {'name2': 1}])