记一次博客托管迁移经历

如果你曾经访问过我的小网站,你可能会注意到我的域名已经从dongsheng2000.gitee.io变成了shengdong00.github.io。 搬迁的原因很简单:我的网站内容被Gitee判为违禁违规了。 当然被判违禁违规也不是第一次了。虽然我认为这个以学习生活记录博客没有任何罪过,但是偶尔因为一两个敏感词语而被ban也完全是可以理解的事情。之前在Sci-Hub + Python爬虫实现文献批量下载这篇记录中因为出现了“非法”一词,曾经被ban过一回。虽然这里并无任何“违反法律”的含义,但是找一个替换词也并不是多大难事。但是前几天的违禁违规问题就没有那么简单了。 首先,系统提示内容违规的内容是大半个月前就已经发布的再读《社会-经济-自然复合生态系统》,在发布该博客之后我又进行了若干次重新部署,一直没有提示违规,直到国庆前夕的这一次更新才出现问题。其次,我不认为这篇博客内容中有任何暴恐、色情、政治敏感的内容。经过简单排查发现,违规内容来自于后半部分(并且不止一处),只不过是对马世骏先生早年论文的部分引用而已。由此我认为,违规问题的出现,归咎于平台在10月到来之前更新了检测系统,并且新上线的检测系统敏感到了草木皆兵的离谱程度。 我起初试图修改内容以通过审核。由于平台并不会提示具体是哪一段文本违规,而我凭借自己的直觉、以及网上的各种违禁违规AI检测工具,都无法解决问题,因此我只能在二分法的基本思想下一点点排查。反复检查的结论是,只有几乎将后一半内容完全砍掉,这篇内容才能通过审核,但这是我所不能接受的。我宁可直接将它删掉,也不愿意看到一段被阉割至二分之一的文字。但是,删掉它并不意味着麻烦的结束,因为平台接着判定我的另一篇内容,系统科学与工程复习整理,违禁违规了…… 如果说前一篇内容还和什么社会什么政策扯一些边,违规还算能理解(不合理,但是能解释)的话,后一篇纯纯是课程复习资料的东西都不能幸免,那我是真的无话可说了。即使我搞定了这两篇的违规内容(不论是阉割还是删除),我也有充足的理由相信还会有第三个受害者出现。 至此,这个问题已经消耗了我大半天的时间和大量的精力。在反复迭代排查的过程中,每一次修改内容、上传部署、审核打回的轮回都需要5~10分钟的时间,整个过程异常枯燥,而我则时时刻刻陷入“难道这玩意儿也是敏感内容”的灵魂拷问之中。最后我放弃修改了,睡觉之前到Gitee官方的页面里提了一个issue,询问部署违禁违规的问题。或许是因为语气冲了一点(当时整个人真的很恼火),用了一些反问句;又或许是因为我复制引用了平台自己的审查规则描述(形如”禁止出现xx内容“之类),从而引入了某些敏感词——总之,第二天醒来的时候,我发现我提的issue也TM的给ban了!😡 于是就有了今天删库跑路,溜到GitHub上边建仓的事情。 本来这一次更新是为了提交一份微信公众平台JS接口安全域名的认证文件,以便于之后需要分享链接到票圈里。这下被迫从Gitee转移到了GitHub上边。这下要在微信公众平台上通过认证,还需要先完成域名绑定、网站备案等等一系列工作。考虑到时间上的经济性,短期内我也不会再去做这件事情了。虽然都说在境内访问GitHub的稳定性时好时坏,但是相比于其他选项来看,这也是最好的情况了。 以前一直觉得互联网的一墙之隔并没有多大的影响,只要我自己进出自由,那么它的存在似乎也无可厚非。现在我不这么觉得了。

October 1, 2022 · 1 min · Sheng, D.