编码
维基百科,自由的百科全书
编码在加密学中的应用已久。编码可将一条信息的内容/意义转换成与真实内容毫不相干的伪内容,从而在传输中可以防止非收信人理解的真实的信息。编码常用的手段是使用“密码本”进行对译。在密码本中,常用短语、词汇与另一些短语、词汇建立一一对应的关系。因此,没有密码本的人收到编码过的信息后,只能看到一些与真实内容无关的伪信息,或者完全没有意义的乱码。电报码就是常用的一种编码。
“编码”经常与“密码”混淆。
这两个词可以依据它们各自的适用范围加以区分。编码的目的在于设定一套规则(密码本),使有意义的信息与伪信息得以互化,与保密与否无关。例如,大多数电报码并不以保密为目的,电报的意义仅在于降低传递信息的成本。编码作用于“语义层”,即单词、短语的转化。在电报码中,单词可以用较少的字符数表达。但是如果信息的发送者只希望特定的收件人看明白内容,而不是所有接收到信息的人都看明白,这样编码中的对译规则就不应被所有人掌握。这时的对译规则(密码本)是秘密的,这种编码就是“加密的编码”。
与“编码”不同,“密码”的目的并不在于信息意义的转换。“编码”可以将“攻击”一词转换成“FRGPL”或“馅饼”,“密码”则作用在“语义层”之下。比如,可以将字母“a”转换成“Q”,也可以第一个“t”变成“f”,第二个“t”变成“3”,等等。有些情况下,“密码”比“编码”更方便,因为“密码”无需反复查询密码本。
“编码”曾一度被认为比“加密”更为安全,因为据认为只要密码本编制合理、保密工作正常,编码过的内容就不大可能通过穷举法、反复对比法等方法而加以破解。如今,随着自动信息处理机器(比如电子计算机)的出现和广泛应用,这种观点已不再成立,“密码”已占据加密学中的主导地位。
“编码”在互联网上十分常用。目前常用的汉字编码主要有“GB 2312”(GB为“国(家)标(准)”的缩写),“HZ”,“Big5”,“Unicode”(UTF)等。如果网页浏览器的网页编码选择不正确,将会看到网页上堆满了乱码。