微信撤回信息昵称显示原理分析

吐槽

为了让各位亲朋好友方便的用撤回信息装x,本宝宝写了一个昵称生成器
虽然是比较简单的页面,但本宝宝还没发布呢,微信就封了这个功能,宝宝心里委屈但宝宝不说…

起因

今天早些时候,在微信群里看到了这样的撤回信息:

1
"牛奶"撤回了一条信息并亲了你一下

开始的时候我是一脸懵逼的,然后知道复制牛奶的昵称,然后再修改就可以实现这个效果,一定要复制,一个字一个字打就不行
之后有同学转发了一篇文章,然后大家纷纷搞出了各种有趣的效果:

1
2
3
1. "zz并亲了你一下"撤回了一条消息
2. "朱饼饼息消条一了回撤"并又瘦了一斤
3. "仝哈哈"撤回了一条消息下一你了亲并

分析

机智的我一开始就猜到,肯定是有些什么看不见的特殊字符导致的。

作为一只前端狗,首先想到的当然是打开web微信,F12,看看昵称里到底是什么鬼,果然不出所料,我的昵称是这样的:‮‮‮ 用卵么什有没并而然‭萝卜

于是开始找这个‮特殊字符到底是做什么的,机智的我很快就找到了^1
首先这种字符叫做Unicode_control_characters^2
要知道更详细的内容(比如这种字符最开始是用于阿拉伯文等东亚文字的排版,另外类似的字符还有好几个,但)可以看看wiki的双向文稿^3,还有其他更详细的使用范例^4

html特殊符号 js unicode 含义
‭ \u202D Unicode Character ‘LEFT-TO-RIGHT OVERRIDE’
‮ \u202E Unicode Character ‘RIGHT-TO-LEFT OVERRIDE’

所以8237的作用是从左到右显示,8238的作用是从右到左显示。

也就是说,跟在8238后面的字符串将从右到左显示(原来的排版方式会被override,直到遇到其他的控制排版的字符(Unicode_control_characters));而跟在8237后面的字符串将从左到右显示。

由于大家在复制的时候根本看不到这些字符,而且可能因为在修改昵称时删除加多了这些特殊符号,所以产生了各种奇怪的效果。而前面提到的最正确我的昵称应该是只有一个8238,也就是这样

1
‮用卵么什有没并而然‭萝卜

微信撤回信息的显示逻辑是,"昵称"+撤回了一条信息,昵称前后是有引号的。
所以实际上,撤回信息的字符串"‮用卵么什有没并而然‭萝卜"撤回了一条信息
根据之前提到的82388237的作用以及前提条件(正常情况下我们看到的字都是从左到右显示),分解过程如下:(LTR从左到右,RTL从右到左)

  1. `第一个引号是正常显示,这个引号是LTR显示的强字符: (”)
  2. ‮后面的 用卵么什有没并而然 是RTL显示的强字符:(”然而并没有什么卵用)
  3. ‭后面的 萝卜”撤回了一条信息 是LTR显示的强字符,所以会紧跟前面的LTR的强字符,也就是紧跟第一个引号 :(”萝卜”撤回了一条信息然而并没有什么卵用)

其他

上面提到的有趣的效果分析:

  1. 根本没有复制到特殊符号
  2. 复制到特殊符号,但”并亲了你一下”被写反了,实际的文本为‮并亲了你一下‭仝哈哈
  3. 复制到的特殊符号不正确,实际的文本为‮斤一了瘦又并‭朱饼饼‮