上图中的人物是在几个月前由计算机安全专家MikkoHyppönen啾啾 ,他以计算机病毒和TED计算机安全方面的工作而闻名。 关于这个,我只会发表一个形象,但你明白了。 这显然不是你想要传播你的网站,并吓坏游客。 经过进一步的检查,这个angular色似乎是一个泰国字母组合的超过87个变音符号(有甚至是一个限制?!)。 这让我想到安全性,本地化以及如何处理这种input。 我的search引导我在Stack上提出这个问题 ,而Michael Kaplan则发表了一篇关于剥离符号的博客文章。 在这个例子中,他演示了如何将一个string分解为它的“基本”字符(为简洁起见,在这里简化): StringBuilder sb = new StringBuilder(); foreach (char c in "façade".Normalize(NormalizationForm.FormD)) { if (char.GetUnicodeCategory(c) != UnicodeCategory.NonSpacingMark) sb.Append(c); } Response.Write(sb.ToString()); // facade 我可以看到这在某些情况下会是有用的,但是在用户input方面,它将删除所有的变音符号。 正如卡普兰指出的那样,删除某些语言的变音符号可以完全改变这个词的含义。 这引出了一个问题: 如何在用户input/输出中允许一些变音符号,但排除其他极端情况,如MikkoHyppönen的人物angular色?
当用英语以外的语言创build网页内容时,出现search引擎优化和用户友好的URL问题。 我想知道在URL中使用去重音字母是否是最好的做法 – 冒着某些词有完全不同的含义,有或没有某种口音 – 或者最好坚持使用非英文字符适当的牺牲在较不高级的环境(如MSIE,查看源)这些url的可读性。 “异国情调”的字母可以出现在任何地方:文件标题,标签,用户名等,所以他们并不总是在网站维护者的全面监督下。 当然,一个可能的方法是设置不同的URL,以指向最初的目的地,但是我想了解一下使用重音URL作为主文档标识符的意见。
我正在尝试为我的应用程序编写一个筛选器函数,它将采用一个inputstring并以某种方式筛选出与给定input不匹配的所有对象。 最简单的方法是使用String的contains方法,即检查对象(对象中的Stringvariables)是否包含filter中指定的string,但是这不包含重音。 有问题的对象基本上是人,我想匹配的string是名字。 因此,例如,如果有人searchJoao,我希望Joáo被包含在结果集中。 我已经在我的应用程序中使用Collator类来按名称进行sorting,并且效果很好,因为它可以进行比较,即使用英国语言区域设置,但是在之前。 但是,如果比较a和á,因为它们不相等,所以它不会返回0。 那么有没有人有任何想法,我可以做到这一点?
我已经find了一个答案,如何删除在stackoverflow变音符号,但你能告诉我,如果有可能改变变音符号非变音符号? 哦..我想.NET(或其他如果不可能)
假设你有以下文字: Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam Lorem! nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor […]
我是新的adnroid,我正在查询sqlite,但问题是当我在我的string中使用重音。 例如: AAA AAA AAA AAA AAA AAA 如果我做: SELECT * FROM TB_MOVIE WHERE MOVIE_NAME LIKE '%a%' ORDER BY MOVIE_NAME; 这是回报: AAA aaa(忽略其他) 但是,如果我这样做: SELECT * FROM TB_MOVIE WHERE MOVIE_NAME LIKE '%à%' ORDER BY MOVIE_NAME; 这是回报: ààà(忽略标题“ÀÀ”) 我想在SQLite数据库中selectstring,而不必关心重音和大小写。 请帮忙。
问题是,如你所知, 在Unicode图表中有成千上万的字符,我想将所有相似的字符转换成英文字母。 比如这里有几个转换: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy –> the Family … 我看到有超过20个字母A / A的版本。 我不知道如何分类。 他们看起来像干草堆里的针。 unicode字符的完整列表在http://www.ssec.wisc.edu/~tomw/java/unicode.html或http://unicode.org/charts/charindex.html 。 只要尝试向下滚动,看看字母的变化。 我怎样才能转换所有这些与Java? 请帮帮我 :(
除了使用String.replaceAll()方法并逐个replace字母之外,是否还有更好的方法来消除重音,并使这些字母有规律地String.replaceAll() ? 例: input: orčpžsíáýd 输出: orcpzsiayd 它不需要包括所有带有俄文字母或中文字母的字母。
我编程导出数据(使用PHP 5.2)到.csvtesting文件。 示例数据: Numéro 1 (注意重音e)。 数据是utf-8 (不包含BOM)。 当我在MS Excel中打开这个文件时,显示为Numéro 1 。 我可以在文本编辑器(UltraEdit)中正确显示它。 UE报告字符是decimal 233 。 如何导出 .csv文件中的文本数据,以便MS Excel能正确呈现它,最好不强制使用导入向导或非默认的向导设置?
如何从string中删除突出的字符? 特别是在IE6中,我有这样的东西: accentsTidy = function(s){ var r=s.toLowerCase(); r = r.replace(new RegExp(/\s/g),""); r = r.replace(new RegExp(/[àáâãäå]/g),"a"); r = r.replace(new RegExp(/æ/g),"ae"); r = r.replace(new RegExp(/ç/g),"c"); r = r.replace(new RegExp(/[èéêë]/g),"e"); r = r.replace(new RegExp(/[ìíîï]/g),"i"); r = r.replace(new RegExp(/ñ/g),"n"); r = r.replace(new RegExp(/[òóôõö]/g),"o"); r = r.replace(new RegExp(/œ/g),"oe"); r = r.replace(new RegExp(/[ùúûü]/g),"u"); r = r.replace(new RegExp(/[ýÿ]/g),"y"); r = r.replace(new RegExp(/\W/g),""); […]