为什么PHP json_encode函数将UTF-8string转换为hex实体?

我有一个处理各种语言的PHP脚本。 不幸的是,每当我尝试使用json_encode ,任何Unicode输出转换为hex实体。 这是预期的行为? 有没有办法将输出转换为UTF-8字符?

以下是我所看到的一个例子:

INPUT

 echo $text; 

OUTPUT

 База данни грешка. 

INPUT

 json_encode($text); 

OUTPUT

 "\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430." 

从PHP / 5.4.0开始,有一个名为"JSON_UNESCAPED_UNICODE"的选项。 一探究竟:

http://se2.php.net/json_encode

所以你应该尝试:

 json_encode( $text, JSON_UNESCAPED_UNICODE ); 

JSON_UNESCAPED_UNICODE可用于PHP版本5.4或更高版本。
以下代码适用于版本5.3。

更新

  • mb_convert_encodingpack + mb_convert_encoding更有效率。
  • (*SKIP)(*FAIL)通过JSON_HEX_*标志跳过反斜杠本身和指定的字符。
 function raw_json_encode($input, $flags = 0) { $fails = implode('|', array_filter(array( '\\\\', $flags & JSON_HEX_TAG ? 'u003[CE]' : '', $flags & JSON_HEX_AMP ? 'u0026' : '', $flags & JSON_HEX_APOS ? 'u0027' : '', $flags & JSON_HEX_QUOT ? 'u0022' : '', ))); $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/"; $callback = function ($m) { return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8'); }; return preg_replace_callback($pattern, $callback, json_encode($input, $flags)); } 

既然你问:

有没有办法将输出转换为UTF-8字符?

另一个解决scheme是使用utf8_encode 。

这会将您的string编码为UTF-8

例如

 foreach ($rows as $key => $row) { $rows[$key]["keyword"] = utf8_encode($row["keyword"]); } echo json_encode($rows); 

这是预期的行为?

json_encode()仅适用于UTF-8编码的数据。

也许你可以得到一个答案在这里转换它: 西里尔字符在phps-json-encode