王权
数据是对客观事实的测量和记录,但是有些客观事实是看不见、摸不着的。患生于所忽,祸起于细微,如果一个投资模型不能涵盖最全面的数据,一个极小的瑕斑也可能导致最终资产配比的偏差。
投资领域的“隐数据”并不是指常见的市盈率、市净率等财务数据,也不是那种已经被行业充分了解、广泛交易,甚至可以在短时间内被准确定价的数据,而是那些需要借助AI技术和非线性算法进行抓取的非结构化数据。
北齐的杜弼在《檄梁文》中讲到一个典故。原文为“但恐楚国亡猿,祸延林木,城门失火,殃及池鱼”。意思是说:楚国国君丢了猿猴,楚国的人去树林里抓猴子,却因此毁坏了林木。城门着了火,人们用护城河的水救火,水用完了,鱼受牵连而死。
我们无法假定抓猴子需要多长时间,也许猴子就在原地,得来全不费功夫,我们也无法假定人类失火一定会取水灭火,因为或许天降暴雨。任何事物在发展过程中都有规律可循,但也存在难以预测的“变数”,这些“变数”可能会产生巨大的连锁反应。那么,人类应当如何探求事物背后千丝万缕的联系,并做到精准的场景预设与数据采集呢?
再来看看“蝴蝶效应”的威力吧。一只南美洲亚马逊河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,可能在两周后引发美国得克萨斯州的一场龙卷风。
蝴蝶翅膀的运动代表着系统初始状态的微小变化,但它引发了一系列事件,从而改变了大气温度,最终改变了世界另一端的龙卷风路径。龙卷风又会带来什么影响呢?海上航运与国际贸易,道琼斯工业平均指数与纳斯达克综合指数,以及股市暴涨暴跌……这之间的因果关系如何提前获知,并用数据精确地表达?
大数据计算已经成为影响世界经济发展的关键变量。在耀眼的数据之下,我们欣狂不已,被已然到来的胜利遮蔽了双眸。由于全球每年几百万吨的塑料垃圾流入大海,并物理分解为微塑料后,会通过食物等途径进入胎儿体内,于是人类想到了使用“可生物降解塑料”替换传统塑料,这样每年可以节约全球4%的化石燃料和2.3%的碳排放。那么以生产“可生物降解塑料”为主营业务的企业是否可以归类到绿色项目范畴呢?答案似乎是显而易见的。
虽然“可生物降解塑料”由玉米、甘蔗、大豆和废油脂等原料制成,废弃后能够被微生物分解为水、二氧化碳和生物质,重新回归自然界。但是我们忽略了另外一个事实:如果“可生物降解塑料”没有得到有效回收和降解,而进入垃圾填埋场,它们在无氧环境下会分解出大量温室气体——甲烷。作为全球第二大温室气体,甲烷的增温效应是同等质量的二氧化碳的80倍以上。
更为惊异的是,如果将一次性塑料制品全部替换为可降解塑料,将会消耗全球一半以上的玉米产量,人们往往只会计算塑料替代带来的碳减排数量,很少会考虑作为全球最主要粮食作物的玉米产量减少对人类社会的影响。粮食锐减将会引发饲料价格增长、贫困饥饿、社会紊乱……
在投资城市基础设施项目时,投资方自信满满地认为资本可以加速当地经济社会发展的进程,实际上并没有将投资可能牵扯到的多维数据尽揽彀中。比如人口流动、车况物流、商品销售、市场价格等一些非线性现象背后的数据表现,项目施工过程中机械设备、道路交通产生的噪声污染对周边居民带来的负外部性影响。
基础数据始于对真实世界的把握,但是世界的本相是否可在现有条件下被精准度量?我们在谈到中国历史上有多少个皇帝以及对他们的历史评价时,获得的一手基础信息实际上来自于《二十四史》,某种程度上依赖于司马迁、班固、陈寿等历朝史官对真实史料掌握的多寡。
秦始皇与汉武帝的记述是否真如史书所载,一个刻薄少恩,一个封禅求仙?“烛影斧声”与“靖康之耻”的记录是否对当初的真相进行了深描或浅描?还有多少尚未发掘或束之高阁、隔绝尘世的孤本史册?看看竹书纪年、清华简和敦煌文献……或许可以说,历史的真相只有部分存在于公开的典籍中,部分封藏于高天厚土中,剩下的再也杳难寻踪了。
在投资实践中,尽管投资方通过融资方信息披露和第三方采集,掌握了大量数据,但在璀璨炫目的显性数据背后还是会有许多潜藏的“隐数据”,即便是在最先进的大数据计算框架内,它们也很难尽显真容。但是,这些“看不见的数据”往往能够从一个更加长期的维度上决定着人类社会的低碳之路能走多远。
破局不仅需要投资理念的迭新升级,更需要投资行业持之不懈加强“算力建设”的坚毅与勇气。投资方与融资方需要穿越数据的“莽丛荆棘”,找寻遁身其间的“茎芽枝叶”,运用包括数据仓库技术、人工智能、神经网络在内的多元工具,将各式各样的数据串接成“知识图谱”,并对图谱中各个网络节点之间的关联性进行充分研判,从大量的“数据矿山”中提取与业务关联性更高、价值更大的“信息金块”。