前言
在现代数字化时代,字体加密已经成为一种常见的保护版权的手段。然而,对于逆向学习者来说,处理加密字体的问题一定会带来挑战。本文将介绍一些关于字体加密如何处理解密的建议和信息,以帮助读者更好地理解和处理这个问题。
目标
高考之音网站,https://www.gaokaozhiyin.cn。找到一个院校的近些年的录取分数线页面。
打开开发者模式,定位到清华大学,或者数字上面。我们得到了“清츪즋쯨(큎큨퀢쿧)((北京))”这个看不懂的字眼,但是页面上是正常显示的。这个就是我们常说的字体加密反爬策略。
逆向过程
首先,我们看到它的class是 cntext,对应右侧的css文件打开,找到相应的字体文件,一般都是woff文件。
下载下来,用High-Logic FontCreator打开文件。同时找到 “清츪즋쯨(큎큨퀢쿧)((北京))”对应的fontcode是什么。
关于怎么找fontcode,这里就不多说,它是接口数据加密,解密后就获取到了。
查看他的规则,츪对应的是华,然后在字体文件里面找到的code后4位是ce2a,说明文件是对的。
第二,就是处理字体里面的内容和对应的code。
对应的code很容易处理,python好多方法。
但是拿到对应的中文文字,这个就难受了。
起初想的是拿到对应的code的对应字符,发现不行。
然后想的是穷举挨个扣下来,太多了,也不现实,也没太多时间。
后来一想,他既然是icon,也就是图片,那干脆用图片文字识别就好了。
第三,识别字体文件
搜索一下在线编辑的字体网站,导入字体文件,然后预览,然后打印成pdf。
然后pdf按章节,分割成不同的图片,然后进行文字识别。
然后去除我们不需要的额外的文字内容,生成一个数组,就搞定了字体对应文字的顺序数组。
编写代码
最后就是把看不懂的内容,替换词可以看懂的内容。
最后
类似的内容还有很多,暂时没发现更高效的方式。
如果有,请来指导一下。