第二十三章 闻所未闻的生物体上(2/2)
有一次,罗教授在考古活动中获得了一本古籍,上面描述大西北荒漠之下有一种奇怪的生物,非人非木,但是极其聪明,找到这生物就能解开生命的奥秘。
我好奇的问。
“你们一直说的DNA是哪里来的?难道你们在送走我之后,找到了那种奇怪生物。”
“你还跟我装傻,就是你让我们对它发射鱼雷的!袭击潜水艇的那家伙,它有一截触须断在了发动机里面,我们取出之后就开始DNA分析。”
交谈间,我们走进了罗教授的实验室,现代化程度很高,可惜玻璃墙壁上贴满了草稿纸。
纸上密密麻麻写着DNA编码。
“CGATGTACATAGGATCAAATGTAC.”
懂基因技术的同学就能知道,这是DNA编码,这四种字母分别代表,A(Adene腺嘌呤),C(Cytose胞嘧啶),G(Guane鸟嘌呤),T(Thye胸腺嘧啶)。
实验室正中间,罗教授独自一人正在分析DNA数据。我疑惑的问金小娟。
“罗教授为很么不找几个学生帮忙呢?”
“都说了这是秘密!知道的人越少越好,有计算机分析,其实也不慢。喂!罗老师我来了,DNA检测怎么样啊?”
罗教授带着老花镜头也没抬,非常疑惑的说。
“地球上,从来没见过这种类型的生物。”
我脑洞大开插嘴道。
“老教授,难道这是外星生物,这是硅基DNA吗?还是氮基DNA?”
罗教授听到我的声音才抬起头,震惊的问金小娟。
“小娟,你怎么把这盗墓贼也带来啦!这里是国家机密!”
“老师,他不是盗墓贼,是我男朋友。叫李在明。”
我嘿嘿的点了点头,罗老脱下眼镜也跟我笑笑,接着又对金小娟调侃道。
“还以为你要杀人灭口呢,给你处理,现在怎么处理成自己男朋友啦!哈哈哈,老喽,年轻人的事我看不明白!”
“老师,说来话长,你跟我们讲讲这生物吧。”
罗教授一边解释,一边把我们带往一处玻璃柜。
“好吧,你们也知道,生物高级与否,与DNA数量并没有直接关系,只跟DNA复杂度有关。虽说如此,可是组成这种生物的DNA竟然有上万对,实在是在太惊人了,我目前只能解析出极少一部分信息。”
玻璃柜里,一根碗口粗细的触手躺在里面一动不动,之前因为听说这种生物十分诡异,真害怕它会突然扭动起来。就在忐忑间,我突然看见触手旁边有几颗珠子,非金非木非石的珠子,和我在黑墟怪那里得到的珠子一模一样,只是颜色有些差异。
我非常惊骇的问罗老。
“教授,这几颗珠子是什么?它们哪里来的?”
罗老推了推老花镜,表情更加的凝重。
“这个珠子是触手里解剖出来的,这触手每隔一段距离,就有一颗珠子长在中间!非常奇怪,而且它纯粹是由DNA和少量的蛋白质组成的,我已经有了初步结论,珠子中的这部分DNA不参与身体构造,好像只储存信息,因为按照珠子中的DNA,完全无法合成蛋白质!而我刚刚说的上万对DNA仅仅是指触手中取出的!”
此时,我已经可以完全肯定,这些珠子和我从黑墟怪那里得到那两颗是同一个种类,只是那两颗我已经丢失在地下海,无法让罗老分析!但我仍然十分感兴趣。
“教授,您说的储存信息是什么意思呢?”
接下来要讲的内容,需要一些数据储存的预备知识。
我用自己的语言来科普一下电脑中的数据原理。
数学稍微好点的都知道,进制间可以很自由的转换,二进制,四进制,八进制,十六进制,或者随便什么进制,它们之间只是表达起来不一样,本质上是一样的。比如01等于1,10等于2,11等于3,111000等于56,前面是二进制表达,后面是十进制表达,为什么要用那么长的二进制表达呢?因为普通电脑介质中的数据,只可以识别成两种状态,带电和不带电。
所以电脑中最原始的数据只有0和1,既然二进制可以表达任何数字,那么怎么表达文字呢,这也很简单,文字总共才几千个,每个文字用一个特定的数字来表示即可,这就是所谓的编码。
接下来是图形,拿RGBA8888类型的图片来说,图片中的每一个像素其实都是一串数字,RGBA,分别表示红,绿,蓝,透明,四个通道的值,所以每一个像素都由这四个通道的值合成,并且可以组合成人眼能识别的任意颜色和透明度。8888指的是每个通道值占8位也就是1字节,8888代表非常好质量的图片,所以二进制位很长,8888不懂可以跳过。这样数字就可以表示任何的图片了,因为图片每一个像素都要用数字表示,所以比起文字来,它的体积要大的多。当然可以用JPEG等压缩方式来优化,压缩原理类似于傅里叶变换。
以此类推,数字当然也可以表示任何声音,任何视频,只要有足够的0和1就能表示计算机里能表示的一切。
但是,明白了以上几点之后,还需要注意一点,那就是一堆0和1的数据,到底用什么方式来理解。如果用文字的方式来理解,那就是数字直接替换成文字,如果是图片的方式来理解,那么按照国际规范,比如jpeg有个头,可以先从开头的数据获得图片的宽高等信息,之后又按照顺序排列像素。所以,有些同学如果用记事本打开一张图片的话,就会产生乱码,因为里面明明存的是像素信息,你却要把它们换成文字来看,当然是毫无意义。这些就是文件格式和后缀名的意义。
最后,如果把0和1看成道家的阴和阳,那么道家所说的太极生两仪,两仪生四相,乃至万物。是有一定道理的,计算机世界中的一切均由0和1演化而来,那么真实世界中的一切均有阴阳两种能量组合而来,当然是有一点的道理的。
科普结束,继续听罗教授分析!。
“你们听说过DNA硬盘吧,利用微流体技术给DNA的ACGT四位编码,只需一个巴掌大小的DNA物质,就能储存目前世界上所有计算机所储存的信息!而我怀疑,这些DNA珠子就是储存信息用的。因为它们的DNA结构完全无法组合成蛋白质。然后我就试着以二维线性的解法来读取这些小球中的ACGT四位编码。”
听到这里,我非常期待罗教授的成果,因为数据这东西很难定义,一大堆的0和1,如果是一个小孩子的涂鸦,那么毫无价值,如果是外星生物发给地球的数据,那么我想所有科学家都会为之疯狂。我急切的问道。
“罗教授,解出来的数据是有意义的吗!”
“DNA硬盘的微流体技术虽有瓶颈,读取速度非常缓慢,但这不是大问题,问题是小球里的DNA实在太多,如果以现在的计算机来解,解到宇宙毁灭也解不完,只有量子计算机才有希望解决!时间有限,我只完成了40kb的数据解析。”
罗老的这一句话,导致我后来花巨资研究量子计算机,也因此发生了第二个故事,这是后话。
“那这40kb的数据,在哪种格式下才有意义?”
罗教授又推了推眼镜,对我很是赞赏。
“哟!小娟你男朋友在计算机领域也很专业那!我试验过英文编码,毫无意义,UTF8编码,毫无意义,GB2312中文编码,毫无意义,其实前面这些测试我没抱任何希望,一个生物体内的数据怎么会跟现代人制定的规则有关呢?”
听到这里我有点沮丧,这些数据需要一个解析的密码才能变得有意义,因为我们实在不知道用何种方式去理解。