Tag: 字符编码

Windows上MBCS和UTF-8的区别

我正在阅读有关Windows上的字符集和编码。 我注意到在Visual Studio编译器(用于C ++)中有两个名为MBCS和UNICODE的编译器标志。 他们有什么区别? 我没有得到的是UTF-8如何在概念上与MBCS编码不同? 另外,我在MSDN中find下面的引用: Unicode是一个16位字符编码 这就否定了我所读到的有关Unicode的内容。 我以为unicode可以编码不同的编码,如UTF-8和UTF-16。 有人可以更多地了解这种混乱吗?

MySQL变音不敏感search(西class牙口音)

我有一个包含西class牙语重音的单词(áéíóú)的MySQL数据库。 我想知道是否有任何方法来做一个变音不敏感的search。 例如,如果我search“lapiz”(没有口音),我想从我的数据库中获得包含单词“lápiz”的结果。 我目前正在查询的方式如下所示: $result = mysql_query("SELECT * FROM $lookuptable WHERE disabled = '0' AND name LIKE '%$q%' OR productCode LIKE '%$q%' LIMIT $sugglimit"); 这是一个网上商店,所以我不知道人们会寻找什么…“lapiz”只是例子。 替代文字http://www.freeimagehosting.net/uploads/0e7c2ae7d5.png 谢谢!

什么是最准确的编码检测器?

经过一番调查,我发现java世界里有几个编码检测项目,如果InputStreamReader中的getEncoding不起作用: juniversalchardet jchardet cpdetector ICU4J 但是,我真的不知道哪一个是最好的。 任何人都可以通过亲身体验告诉我哪一个是Java中最好的?

猜测在Java中表示为byte 的文本的编码

给定一些代表某些未知编码(通常是UTF-8或ISO-8859-1,但不一定如此)的文本的字节数组,最好的方法是获得最可能使用的编码(在Java中)的猜测? 值得注意: 没有额外的元数据可用。 字节数组实际上是唯一可用的input。 检测algorithm显然不是100%正确的。 如果algorithm在80%以上的情况下是正确的,那就足够了。

request.getQueryString()似乎需要一些编码

我有一些UTF-8的问题。 我的客户端(以GWT实现)向我的servlet发出一个请求,在URL中有一些参数,如下所示: http://localhost:8080/servlet?param=value 当在servlet中检索URL时,我有一些UTF-8字符的问题。 我使用这个代码: protected void service(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { request.setCharacterEncoding("UTF-8"); String reqUrl = request.getRequestURL().toString(); String queryString = request.getQueryString(); System.out.println("Request: "+reqUrl + "?" + queryString); … 所以,如果我打电话给这个url: http://localhost:8080/servlet?param=così 结果是这样的: Request: http://localhost:8080/servlet?param=cos%C3%AC 我能做些什么来正确设置字符编码?

UTF-8字符编码的战斗json_encode()

寻求 我正在寻找获取具有重音字符的行。 列( NAME )的编码是latin1_swedish_ci 。 代码 以下查询使用phpMyAdmin返回Abord â Plouffe : SELECT C.NAME FROM CITY C WHERE C.REGION_ID=10 AND C.NAME_LOWERCASE LIKE '%abor%' ORDER BY C.NAME LIMIT 30 以下显示期望值(函数称为db_fetch_all( $result ) ): while( $row = mysql_fetch_assoc( $result ) ) { foreach( $row as $value ) { echo $value . " "; $value = utf8_encode( $value ); […]

如何从PHP中的unicode代码点获取字符?

例如, 如何获得对应于U + 010F的字符?

PHP输出显示带有问号的黑色小钻石

我正在写一个从数据库源拉的PHP程序。 一些变数的引号显示为黑色菱形,其中带有问号( , replace字符 ,我从Microsoft Word文本中假设)。 我如何使用PHP去除这些字符?

你如何正确使用WideCharToMultiByte

我已经阅读WideCharToMultiByte的文档,但我坚持这个参数: lpMultiByteStr [out] Pointer to a buffer that receives the converted string. 我不太清楚如何正确地初始化variables并将其馈送到函数中

PHP搞乱HTML字符集编码

我有这个很奇怪的问题。 我有一个网站,包含一些德国的信件,当它只是没有PHP的HTML符号属性显示与编码时,我把它改为UTF-8他们不显示,而不是Ö我得到 。 当我把PHP放在PHP里面,用Zend工作室在Wamp上用charset = iso-8859-1编码启动它时,我得到了ï而不是Ö(我想补充一点,这个Ö是一个单选button的值) 。 当它在一个 标记显示正确。 你能告诉我如何解决这个问题。 我看看其他网站,他们有UTF-8编码和正确显示相同的符号。 我试图改变PHP的edior编码,但它并不重要,我认为 – > Zend Studio的编辑器中的一切正常显示…提前谢谢。