在MIME编码的引用可打印的文本中,“= C2 = A0”是什么?
这是我想parsing的一个例子原始电子邮件:
MIME-version: 1.0 Content-type: text/html; charset=UTF-8 Content-transfer-encoding: quoted-printable X-Mailer: Verizon Webmail X-Originating-IP: [xxxx] =C2=A0test testing testing 123
什么是= C2 = A0? 我已经尝试了六打引号打印的parsing器,但没有正确处理。 如何正确parsing这在C#中?
老实说,现在我正在编码:
//TODO WTF encoded = encoded.Replace("=C2=A0", "");
因为我无法弄清楚为什么这个文本在MIME内容中是随机存在的,不应该被渲染成任何东西。 通过删除它,我得到了预期的效果 – 但为什么?
要清楚,我知道(= [0-9A-F] {2})是一个编码字符。 但在这种情况下,它似乎代表什么。
“= C2 = A0”代表字节C2A0。 但是,由于这是UTF-8,因此它转换为00A0,这是非破坏性空间的Unicode。