Tag: utf

如何更正文件的字符编码?

我有一个ANSI编码的文本文件,不应该被编码为ANSI,因为有ANSI重音字符不支持。 我宁愿使用UTF-8。 数据可以正确解码还是在转码中丢失? 我可以使用哪些工具? 这里是我所拥有的一个样本: ç é 从上下文(café应该是咖啡馆)我可以看出这些应该是这两个字符: ç é

什么是UTF-16的重点?

我从来没有理解UTF-16编码的重点。 如果需要将string视为随机访问(即代码点与代码单元相同),则需要UTF-32,因为UTF-16的长度仍然是可变的。 如果你不需要这个,那么与UTF-8相比,UTF-16似乎是一个巨大的空间浪费。 UTF-16与UTF-8和UTF-32相比有什么优势?Windows和Java为什么使用它作为它们的本地编码?

ISO-8859-1 vs UTF-8?

应该使用什么和什么时候? 还是总是使用UTF-8更好? 或ISO-8859-1在特定条件下仍然具有重要性? 字符集是否与地理区域相关? 编辑: 把这个代码放在@charset "utf-8";有什么好处吗@charset "utf-8"; 或者像这样<link type="text/css; charset=utf-8" rel="stylesheet" href=".." /> 在CSS文件的顶部? 我find了这个 如果在向文档添加embedded式样式时DreamWeaver添加了标签,那么这是DreamWeaver中的一个错误。 从W3C FAQ: “对于文档中embedded的样式声明,不需要@charset规则,不能使用。” charset规范自2.0版本(1998年5月)以来就是CSS的一部分,所以如果你在CSS文件中有一个字符集规范,并且Safari无法处理它,这就是Safari中的一个bug。 并在表单中添加accept-charset <form action="/action" method="post" accept-charset="utf-8"> 以及如果我使用xhtml文档types应该使用什么 <?xml version="1.0" encoding="UTF-8"?> 要么 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

显示在文件中的<0xEF,0xBB,0xBF>字符。 如何删除它们?

我在做压缩的JavaScript文件,压缩机抱怨我的文件中有字符。 我如何search这些字符并将其删除?

Android WebView带有乱码的UTF-8字符。

我在我的android应用程序中使用一些网页浏览,但无法使它们以utf-8编码显示。 如果使用这一个,我不会看到我的斯堪的纳维亚人: mWebView.loadUrl("file:///android_asset/om.html") 如果试试这个,我什么也看不到 mWebView.loadDataWithBaseURL("file:///android_asset/om.html", null, "text/html", "utf-8",null); 问候

UTF-8和UTF-16的区别?

UTF-8和UTF-16的区别? 为什么我们需要这些? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();

UTF-8,UTF-16和UTF-32

UTF-8,UTF-16和UTF-32之间有什么区别? 我明白,他们将全部存储Unicode,并且每个使用不同数量的字节来表示一个字符。 select一个在另一个之上有好处吗?

可以用Unicode映射多less个字符?

我要求统计所有可能的有效组合的计数与解释。 我知道一个字符可以被编码为1,2,3或4个字节。 我也不明白为什么连续字节有限制,即使该字符的起始字节清除应该多长时间。

哪种编码可以在Mac和Windows上使用Excel正确打开CSV文件?

我们有一个Web应用程序,可以导出包含UTF-8外部字符的CSV文件,而不需要BOM。 Windows和Mac用户都在Excel中获取垃圾回收字符。 我试图用BOM转换成UTF-8; Excel / Win很好,Excel / Mac显示乱码。 我正在使用Excel 2003 / Win,Excel 2011 / Mac。 以下是我尝试的所有编码: Encoding BOM Win Mac ——– — —————————- ———— utf-8 — scrambled scrambled utf-8 BOM WORKS scrambled utf-16 — file not recognized file not recognized utf-16 BOM file not recognized Chinese gibberish utf-16LE — file not recognized file not recognized […]

Unicode,UTF,ASCII,ANSI格式的区别

Unicode , UTF8 , UTF7 , UTF16 , UTF32 , ASCII和ANSI编码有什么区别? 这对程序员有什么帮助?