Ruby 1.9:我怎样才能正确地提升和取消多字节string?
所以matz决定在Ruby 1.9.1中保持上/[AZ]/i
downcase
为/[AZ]/i
。
ActiveSupport::Multibyte
在Ruby 1.8.x中通过String#mb_chars
已经有了很好的i18n情况。
但是,在Ruby 1.9.1下试用时,它似乎不起作用。 下面是我写的一个简单的testing脚本,以及我得到的输出:
$ cat test.rb # encoding: UTF-8 puts("@ #{RUBY_VERSION} " + (__ENCODING__ rescue $KCODE).to_s) sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN" def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end ps sd.upcase, su.downcase, "Plain ruby" require 'rubygems'; require 'active_support' ps sd.upcase, su.downcase, "With active_support" ps sd.mb_chars.upcase.to_s, su.mb_chars.downcase.to_s, "With active_support mb_chars" $ ruby -KU test.rb @ 1.8.7 UTF8 Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn With active_support mb_chars : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn $ ruby1.9 test.rb @ 1.9.1 UTF-8 Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn With active_support mb_chars : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
那么,我如何通过Ruby 1.9.1来实现国际化呢?
更新
我应该补充一点,我还使用ActiveSupport从当前的master
,GitHub的2-3-*
和3-0-unstable
rails分支进行了testing。 相同的结果。
大小写转换是依赖于语言环境的,并不总是往返,这就是为什么Ruby 1.9不包含它(请看这里和这里 )
unicode-util gem应该能够满足您的需求。
对于任何人从谷歌来的ruby upcase utf8
:
> "your problem chars here çöğıü Iñtërnâtiônàlizætiøn".mb_chars.upcase.to_s => "YOUR PROBLEM CHARS HERE ÇÖĞIÜ IÑTËRNÂTIÔNÀLIZÆTIØN"
解决方法是使用mb_chars
大小写转换是复杂的并且依赖于语言环境。 幸运的是,MartinDürst在Ruby 2.4中添加了完整的Unicode格式映射 :
puts RUBY_DESCRIPTION sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN" def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end ps sd.upcase, su.downcase, "Ruby 2.4 (default)" ps sd.upcase(:ascii), su.downcase(:ascii), "Ruby 2.4 (ascii)" ps sd.upcase(:turkic), su.downcase(:turkic), "Ruby 2.4 (turkic)" ps sd.upcase(:lithuanian), su.downcase(:lithuanian), "Ruby 2.4 (lithuanian)" ps "-", su.downcase(:fold), "Ruby 2.4 (fold)"
输出:
ruby 2.4.0dev (2016-06-24 trunk 55499) [x86_64-linux] Ruby 2.4 (default) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn Ruby 2.4 (ascii) : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn Ruby 2.4 (turkic) : IÑTËRNÂTİÔNÀLİZÆTİØN / ıñtërnâtıônàlızætıøn Ruby 2.4 (lithuanian) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn Ruby 2.4 (fold) : - / iñtërnâtiônàlizætiøn