随后是断句,苏御发现有些方块字直接由一个空格将其隔开,因此将不同的字区分成不同的区域,每一个区域便可以理解成一句话。
然后是标注,作为一份报告,肯定是有标注,有特别说明,比如中文论文里的“注1”“注2”,或者()。
而这些文件内也有类似这样的标注,有了这些标注后,再去破解原文,难度就会降低许多。
而随后,就是纷繁复杂的统计学工作,将文件中所有的文字全部提取出来,提取出所有的常用文字,提取出偶尔使用的文字,提取出只是用过一次的文字。
从而再进行统计学分析,和目前人类已知的文字进行对照,寻找语法相似的文字。
众所周知,中文和英文互为倒装句。
简单来说,中文是:今天你吃了吗?
英文是:你吃了吗?今天。
而经过苏御长达数天的分析,万界统合的文字和中文的语法更为接近,这让苏御松了口气,因为中文的文字数量更多,更利于进行统计学对照分析。
苏御继续那万界统合的文字和中文进行对比,并用这种很笨的方法来破译万界统合的文字。
这将是一个漫长的过程,但苏御有的是时间。
而且,苏御可以偷懒,那就是他可以将算法和程序编入计算机,并借助计算机来为他破译万界统合的文字。
确定目标后,苏御立刻开始行动,他直接找到了世界上运算速度最快的
第六十七章 获得好处,解析文件(4/5)