Tag: 字符编码

Windows上MBCS和UTF-8的区别: 我正在阅读有关Windows上的字符集和编码。我注意到在Visual Studio编译器（用于C ++）中有两个名为MBCS和UNICODE的编译器标志。他们有什么区别？我没有得到的是UTF-8如何在概念上与MBCS编码不同？另外，我在MSDN中find下面的引用： Unicode是一个16位字符编码这就否定了我所读到的有关Unicode的内容。我以为unicode可以编码不同的编码，如UTF-8和UTF-16。有人可以更多地了解这种混乱吗？

MySQL变音不敏感search（西class牙口音）: 我有一个包含西class牙语重音的单词（áéíóú）的MySQL数据库。我想知道是否有任何方法来做一个变音不敏感的search。例如，如果我search“lapiz”（没有口音），我想从我的数据库中获得包含单词“lápiz”的结果。我目前正在查询的方式如下所示： $result = mysql_query("SELECT * FROM $lookuptable WHERE disabled = '0' AND name LIKE '%$q%' OR productCode LIKE '%$q%' LIMIT $sugglimit"); 这是一个网上商店，所以我不知道人们会寻找什么…“lapiz”只是例子。替代文字http://www.freeimagehosting.net/uploads/0e7c2ae7d5.png 谢谢！

什么是最准确的编码检测器？: 经过一番调查，我发现java世界里有几个编码检测项目，如果InputStreamReader中的getEncoding不起作用： juniversalchardet jchardet cpdetector ICU4J 但是，我真的不知道哪一个是最好的。任何人都可以通过亲身体验告诉我哪一个是Java中最好的？

猜测在Java中表示为byte 的文本的编码: 给定一些代表某些未知编码（通常是UTF-8或ISO-8859-1，但不一定如此）的文本的字节数组，最好的方法是获得最可能使用的编码（在Java中）的猜测？值得注意：没有额外的元数据可用。字节数组实际上是唯一可用的input。检测algorithm显然不是100％正确的。如果algorithm在80％以上的情况下是正确的，那就足够了。

request.getQueryString（）似乎需要一些编码: 我有一些UTF-8的问题。我的客户端（以GWT实现）向我的servlet发出一个请求，在URL中有一些参数，如下所示： http://localhost:8080/servlet?param=value 当在servlet中检索URL时，我有一些UTF-8字符的问题。我使用这个代码： protected void service(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { request.setCharacterEncoding("UTF-8"); String reqUrl = request.getRequestURL().toString(); String queryString = request.getQueryString(); System.out.println("Request: "+reqUrl + "?" + queryString); … 所以，如果我打电话给这个url： http://localhost:8080/servlet?param=così 结果是这样的： Request: http://localhost:8080/servlet?param=cos%C3%AC 我能做些什么来正确设置字符编码？

UTF-8字符编码的战斗json_encode（）: 寻求我正在寻找获取具有重音字符的行。列（ NAME ）的编码是latin1_swedish_ci 。代码以下查询使用phpMyAdmin返回Abord â Plouffe ： SELECT C.NAME FROM CITY C WHERE C.REGION_ID=10 AND C.NAME_LOWERCASE LIKE '%abor%' ORDER BY C.NAME LIMIT 30 以下显示期望值（函数称为db_fetch_all( $result ) ）： while( $row = mysql_fetch_assoc( $result ) ) { foreach( $row as $value ) { echo $value . " "; $value = utf8_encode( $value ); […]

PHP输出显示带有问号的黑色小钻石: 我正在写一个从数据库源拉的PHP程序。一些变数的引号显示为黑色菱形，其中带有问号（， replace字符，我从Microsoft Word文本中假设）。我如何使用PHP去除这些字符？

你如何正确使用WideCharToMultiByte: 我已经阅读WideCharToMultiByte的文档，但我坚持这个参数： lpMultiByteStr [out] Pointer to a buffer that receives the converted string. 我不太清楚如何正确地初始化variables并将其馈送到函数中

PHP搞乱HTML字符集编码: 我有这个很奇怪的问题。我有一个网站，包含一些德国的信件，当它只是没有PHP的HTML符号属性显示与编码时，我把它改为UTF-8他们不显示，而不是Ö我得到。当我把PHP放在PHP里面，用Zend工作室在Wamp上用charset = iso-8859-1编码启动它时，我得到了ï而不是Ö（我想补充一点，这个Ö是一个单选button的值）。当它在一个标记显示正确。你能告诉我如何解决这个问题。我看看其他网站，他们有UTF-8编码和正确显示相同的符号。我试图改变PHP的edior编码，但它并不重要，我认为 – > Zend Studio的编辑器中的一切正常显示…提前谢谢。