来自先锋10号任务的木星图像,包含在NSSDCA档案中。
来自先锋10号任务的木星图像,包含在NSSDCA档案中。(图片来源:NASA/Lonnie Shekhtman)
来自太空任务的宝贵数据可以追溯到几十年前,科学家们正在美国国家航空航天局的空间科学数据协调档案馆仔细恢复和存档,使今天的研究人员能够通过深入研究历史书籍来做出新的发现。
美国国家空间科学数据中心档案馆(NSSDCA)的行星科学家大卫·威廉姆斯告诉Space.com:“令人惊讶的是,这些信息中有多少要么丢失了,要么至少没有处于任何人都可以使用的状态。”“我们有大量的照片、各种任务的胶片、大量的缩微胶片和缩微胶片。我们正在慢慢地处理它。”
在美国各地机构的档案馆、地下室和被遗忘的储藏室中寻找和恢复这些旧数据所需的侦探工作再重要不过了;今天的研究人员仍然可以使用出土的数据来帮助指导未来的任务。例如,以美国国家航空航天局DAVINCI(深大气层金星稀有气体、化学和成像调查)任务的团队为例,该任务将于2030年代初开始金星之旅。这将是自20世纪90年代以来美国领导的第一次专门的金星任务(自那以后,欧洲和日本都回到了金星)。它在二氧化碳笼罩的行星上的目标之一是一个名为阿尔法区域的大陆大小的高原,这是一个巨大的变形表面特征的镶嵌体,与火山活动和可能的撞击有关。
因此,为了了解DAVINCI应该在Alpha Regio上寻找什么,该任务的科学家团队回到了过去,将现代分析和机器学习技术应用于20世纪90年代初美国国家航空航天局麦哲伦-金星任务的数据,再加上一些档案阿雷西博雷达数据。目标是绘制一张新的阿尔法区域地图,并确定可能被忽视的镶嵌体上令人费解的地质结构。今年早些时候,研究人员在麦哲伦1990年至1992年的数据中发现了火山活动的证据。
如果不是美国国家航空航天局戈达德太空飞行中心太空科学数据协调档案(NSSDCA)团队的辛勤工作,这些旧数据都不会可用,也不会处于可用状态。NSSDCA的工作是恢复和数字化所有行星际空间任务的数据。船员们一起寻找美国宇航局最早的一些任务中丢失的数据,包括阿波罗登月任务。(其他机构负责其他类型任务的数据;例如,管理哈勃和詹姆斯·韦伯太空望远镜的太空望远镜科学研究所也负责将天文台的数据存档。)
作为NSSDCA的负责人,大卫·威廉姆斯可能是美国国家航空航天局最好的工作之一。他的角色不仅仅是档案管理员;它还扮演着侦探的角色,找出丢失的数据可能潜伏在哪里,然后找出这些数据告诉我们什么,以及应该如何格式化,以便对子孙后代的天文学家有用。
“我喜欢这方面,”他在接受Space.com采访时热情地说。“试图挖掘数据并找出答案是我在这里最开心的时候。”
在20世纪80年代中后期之前,对于如何存档太空任务收集的珍贵天文数据,没有任何规定。事实上,一些研究人员甚至根本懒得归档他们的数据。到20世纪80年代末,美国国家航空航天局行星数据系统(PDS)的当局,作为行星科学数据的一站式商店,展示了他们的力量,开始坚持档案程序,甚至拒绝向没有存档数据的研究人员提供资金。确保事情正确归档的工作落在了威廉姆斯和NSSDCA的肩上。
他说:“现在你知道,如果自麦哲伦(1989年)以来或前后有过一次任务,数据将得到很好的记录,并且几乎没有例外。”然而,对于在此之前的任务,数据的可用性和质量可能是一场冒险。
包含1964年水手4号火星任务数据的缩微胶片。(图片来源:NASA/Lonnie Shekhtman)
威廉姆斯说:“实际上,早在80年代中期,就没有关于数据归档的系统规则。”“这是我开始做这件事时学到的很多东西。”
现在,在申请资金时,研究人员不仅必须提交所有原始数据,还必须提交解释数据测量内容以及如何显示的文件。研究人员必须接受“数据审查”,威廉姆斯和他的同事仔细审查数据和文件,确保他们拥有所需的一切——任何布局不充分的东西都会被送回研究人员进行修复。
在引入这一严格的验证方案之前,仍有大量来自实验和任务的数据尚未存档,文档不完整,甚至可能永久缺失。
威廉姆斯说:“文件和数据一样重要。我们过去常常收到一箱带求职信的磁带,‘这是某个任务的所有数据’,我们想知道:‘我们应该怎么处理这些数据?’”。“对于真正古老的东西,甚至没有人可以谈论它,所以你必须自己找出实验是如何运作的。”
如今,所有东西都被数字化和备份,但原始来源——无论是打印出来的、缩微胶片还是九轨磁带——都被保留在一个“档案信息包”中,该包基本上只是一个带有数据ID的包装。因为成箱的打印出来可能会占用很多空间,在过去,许多打印出来的东西都被转移到缩微胶片和缩微胶片(包含打印项目缩小图像的透明胶片)上,但现在NSSDCA工作人员的很多时间都花在了对这些缩微胶片进行数字化上,在这个过程中,他们发现了档案中令人担忧的空白和漏洞。
金星阿尔法区的新地图,由麦哲伦和阿雷西博收集的数据制成,并使用新的机器学习技术进行了重新分析
金星阿尔法区域的新地图,由麦哲伦和阿雷西博收集的数据制成,并使用新的机器学习技术进行了重新分析(图片来源:Jim Garvin/NASA戈达德太空飞行中心)
“我意识到我坐在那里,手里拿着这些缩微胶卷,它们是维京生物实验中唯一剩下的东西”
戴维·威廉姆斯威廉姆斯说:“大约15年前,我们收到了某人要求提供维京生物实验数据的请求。”这是1976年在两艘维京着陆器上进行的一项实验,旨在测试火星土壤样本中是否存在微生物。威廉姆斯认为所有的生物实验数据都在缩微胶片上,但当他坐在档案馆里筛选与实验有关的文件,试图找到所需的数据时,他找不到了。威廉姆斯沉思道,也许这些数据已经被丢弃了,或者坏了。
他说:“我意识到,我坐在那里,手里拿着这些缩微胶片盒,它们是维京生物实验留下的唯一东西。”。“如果这些缩微胶片发生了什么事,它们就会消失。所以我说,让我们现在就把它数字化,把副本发给我们认识的每个人,确保它不会丢失。这是一个可怕的想法,我确实相信,从旧的任务中,有数据丢失了,我们永远也找不到了。”
有时,丢失数据背后的故事比被扔进垃圾桶更奇怪。
以ALSEP站为例。阿波罗月球表面实验包(Apollo Lunar Surface Experiment Packages)的缩写,这些是阿波罗11号之后每次登月任务在月球上留下的科学站(阿波罗11号部署了一个更简单的包,但基本上还是一样的)。ALSEP站记录了温度、月震、宇宙射线暴露、地下热流、月球引力场和磁场等信息。ALSEP站不断地读取这些读数,并将其传回地球,直到1977年这些站被关闭。
他们的数据被存储在加尔维斯顿德克萨斯大学的磁带上,然后《海洋哺乳动物保护法》出台了。
这与天文数据有什么关系?“这就是为什么它如此奇怪!”威廉姆斯说。以前,磁带使用鲸油作为润滑剂,以防止它们变干或卡在磁带播放器中。
威廉姆斯说:“事实证明,鲸油是电脑磁带的完美润滑剂,因为它是不导电的,不会损害磁性基板,它确实具有磁性,也不会弄乱磁带读取机。”
随着《海洋哺乳动物保护法》的通过,鲸油不再被使用。没关系;一家公司预见到了这一点,并设计了一种新的润滑剂来取代鲸油。但六个月后,人们发现新的润滑剂正在使磁带变干,并导致磁带播放器撕裂。
这让美国国家航空航天局陷入了困境。数据一直来自卫星和行星际任务,他们需要磁带来记录这些数据。没有时间等待有人提出新的润滑剂,因为他们需要一个地方来存储所有这些新的传入数据。
威廉姆斯说:“所以,他们开始掠夺那些上面还有鲸油的旧磁带,并在上面写字。”“在某个时候,有人发现了ALSEP磁带并在上面写了下来,所以现在它们不见了。”“其他的都不见了,都是因为鲸油!”
幸存下来的只有一堆磁带,其中包含来自ALSEP站的大约两周的数据,一些研究人员一定是在掠夺开始前从档案馆借来的。
“其他的都不见了,”威廉姆斯说。“都是因为鲸油!”
阿波罗任务中成堆的缩微胶片,包括剩余的ALSEP数据。
阿波罗任务中成堆的缩微胶片,包括剩余的ALSEP数据。(图片来源:NASA/Lonnie Shekhtman)
幸运的是,今天我们不需要依赖鲸油或磁带。所有新数据都是数字化的,旧数据也在数字化过程中。当然,现在一切都在云端,但硬拷贝仍然存在于两个地方:一个在NSSDCA,两个在一个被称为“铁山”的地方
威廉姆斯说,铁山实际上是一家公司的名字,该公司拥有“一个人人都使用的大型档案馆,它们距离华盛顿特区附近马里兰州的NASA戈达德大约20或30英里”。他们的名字让人想起一座巨大的、无法穿越的山,里面从地板到天花板堆放着服务器、盒子和成堆的磁带。
这实际上与事实并不太远,或者说,至少,与过去的事实并不太遥远。
威廉姆斯说:“最初,他们在宾夕法尼亚州确实有一座‘山’,这是一座巨大的矿井,他们用来储存东西,这样就可以完全保护它免受任何事情的影响。”“这就是为什么它被称为铁山。”
除了核战争,数据应该是安全的。即使正如威廉姆斯开玩笑说的那样,龙卷风摧毁了NSSDCA,铁山的备份数据也是安全的。威廉姆斯笑着说:“如果发生了如此大的事情,导致NSSDCA和铁山都被摧毁,那么我们可能会担心比丢失一些天文数据更大的事情。”
如今,比自然灾害更大的威胁是可怕的计算机软件或媒体更新。我们都见过它们——我敢打赌,你在某个时候将程序更新到了最新版本,结果却发现它无法打开你最旧的文件。或者,考虑一下现在被丢弃在垃圾填埋场的VHS磁带堆,仅仅是因为我们消费媒体的方式已经发生了变化。
因此,归档数据的关键是使其面向未来,这样我们在50年或100年后仍然可以打开并读取它。
威廉姆斯说:“我们试图跟上媒体的步伐,因为媒体比实际的机器阅读媒体的时间更长。”“我们有所有的九轨磁带,但不再有九轨磁带阅读器了。”
更广泛地说,“在以现代格式提供数据和制作未来有人能够打开的东西之间,存在着一种自然的竞争,而不是说,‘哦,我不知道谷歌电子表格是什么,’”他说。
因为软件一直在变化,在NSSDCA,他们试图使用最简单的东西,比如ASCII表。ASCII代表美国信息交换标准代码。威廉姆斯说,它使用数字来表示没有格式的字符,在计算和互联网上很普遍,可以被任何软件使用,而不是Excel电子表格,“它甚至可能在未来都不存在”。
目前,威廉姆斯和他的团队正在整理、恢复和数字化1978年至1992年间执行的美国国家航空航天局先锋金星任务的旧数据,以迎接即将到来的DAVINCI任务、VERITAS(金星发射率、无线电科学、InSAR、地形和光谱学)任务和欧洲的金星EnVision任务,所有这些任务都有望在2020年代末和2030年代初发射。
来自先锋10号任务的木星图像,包含在NSSDCA档案中。(图片来源:NASA/Lonnie Shekhtman)
威廉姆斯说:“我们认为很多数据可能有用。”事实上,正如我们在本文顶部看到的,DAVINCI团队已经在使用它了。
研究人员一直在回顾旧数据,应用新的处理和分析技术来梳理新的信息。谁知道在几十年前的测量中,还有什么发现在等着我们呢?
作为这些秘密的守护者,这一切都要归功于大卫·威廉姆斯和他的团队为后人提供了这些数据。
编丨潇歌
图丨网络
仅作交流分享,版权归原作者所有,如有侵权,请与我们联系删除
----- 推荐以下行业专业公众号 -----
新空间航天
需要进入航空航天圈交流群的朋友,
在公众号对话框回复关键词:入群
免责声明:本文及本公众号任何文章之观点,皆为交流探讨之用,不构成任何投资建议。本公众号作者也不负有更新以往文章观点之责任,一切以最新文章为准。用户根据本文及本公众号任何其他观点进行投资,须风险自担,责任自负。由此造成的一切后果,本公众号不承担任何责任。
⊙部分图文源于网络,仅用于学习交流,版权归原作者所有,如有侵权请联系我们删除。
欢迎航天航空圈内企业约稿、圈内人士投稿
邮箱:39813880@qq.com