杞人忧天:数据/大数据/与科学真实
发布时间:
2021-04-22 09:43
【摘要】:
现代社会,“科学”变成了被滥用到极端的时髦概念,差不多成了化妆词汇,因其普及而逐渐迷失根本了。究竟什么是科学,还是抄一段反映其历史本源、国际社会没啥争议的定义(维基百科)吧:Science (from the Latin word scientia, meaning "knowledge") is a systematic enterprise that builds and organizes knowledge in the form of testable explanations and predictions about the universe. 科学是系统建立及组织关于对宇宙(自然)真实存在(真理)认知的学问体系,其核心组成是可验证的理论预测。所关心的是预见自然现象的理论、方法。科学与否,正在于其是否可以验证。
离开定义,就陷入中国春秋战国式“道不可道”之路数,各讲各的、鸡同鸭讲啦。在现实中文语境下,科学与技术往往混为一谈。就实质而论,科学所关心的是发现或预见未知存在,主旨是理论问题,相当于社会学的“思想”,可能是有用的,也可能是无用的。而技术,则是物化有用科学发现的措施,属于工艺方法范畴,相当于社会学的“主义”。
科学的重要特点在于其“实证性”:靠事实证明或者证伪。目的是发现自然界的真实存在或属性,包括好的或不好的。其方法论包涵逻辑理论演绎与实验观察分析。后者为构建理论体系提供现象数据经验支撑,用以依托理论、证明理论、推翻理论。也是目下风靡世界的大数据方法的基础性支撑。
但令人遗憾的是,由于受社会的“功利”价值影响,不美好的真实与不漂亮的数据往往不受待见,导致科学论文的价值往往与“有用的”性能指标挂钩,严重削弱负反馈对真理发现的重要贡献,这也许与很多所谓热点领域、成吨论文整不出一个可靠技术有些关系。这种现象对依靠“大数据”的各类“新工科、新科学”的可能歪曲,不待智者而知之。
这让我不免记起年轻时1篇小论文的小插曲:90年代末期在萨利大学工作期间,系里由于承受不了学校当时引入的办公/实验室面积收费“新政”,关了资料室,后来经历了2次机构整改,精简师资、实验室编制,并系建院、并院建学部,增编专职经理,促进综合办学效益。英国大学的滑铁卢惨淡过程,大概与这种所谓“面向社会办学”的公司化“改革”,密切相关…
书归正传,资料室书籍堆了一地,让大家随便挑拣有用的收藏。所以我收了一套大家看不上眼的老版《皮尔申》手册等一大摞旧书,顺便把手册中当时关心的金属固溶体晶体学数据整理下(60/70年代数据),发现了与化学有序直接相关的晶格参数偏离混合物定律现象,写了篇小论文,一个月后被一个 X 编辑拒了,说审稿人认为数据太老了些。奇怪的是不久后另一个编辑 Y 告诉我文章很好,评审建议多发这样的工作,他已经送往出版社了,说他刚接手不幸谢世的 X 编辑处转来的文章云云……
后来把计算机比较普及的80年代之后的晶体数据补进来,数据点立马满天飞。原因很简单,数字化“傻瓜”仪器普及之后,很少有人再关心可靠检测需要精确标定这个简单常识(内标、外标、最小二乘法处理、样品同轴…)。比如现在做能谱分析,还有几个人关心ZAF矫正、K因子、标准谱数据库的可靠性、探头窗口厚度的影响甚至晶体取向的影响?要靠这种“高效率/傻瓜/先进仪器”数据建立数据规律,不免让人心中打鼓。
等而下之,现在学术界功利快餐风气猖獗,看文献多集中在所谓顶刊综述二手来源,追风名人大咖大作,造成原始文献大量尘封,许多早已发明过的圆形车轮,不免被人重新发明成椭圆的……
--------------邵老师随笔