2022年6月25日上午,kaiyun体育登录网页入口文科资深教授、kaiyun体育登录网页入口讲席教授陈国青受邀在中国留美经济学会(CES)2022年会上做了题为“大数据驱动-新型研究范式”(“Bigdata-Driven: a New Methodological Paradigm for Economics and Business Research with AI/Machine Learning”)的主题演讲。
陈国青指出,传统研究范式可以分为两大类,即“模型驱动”与“数据驱动”。在模型驱动范式下,以实证类的行为构念模型和统计计量模型为例,研究者基于观察抽象和理论推演建立概念模型和关系假设,利用相关数据(如问卷、面板数据等)对假设进行检验。模型驱动范式有助于建立变量之间的因果联系,形成对要素影响路径的有效解释。模型驱动范式在经济学和管理学研究中发挥了重要作用。然而,在大数据背景下,这种范式的局限性使得不易发现已有知识结构之外的潜隐变量,同时还面临着一些要素和变量在传统意义上不可测或不可获,以及变量组合规模和复杂性的激增所带来的建模困难等问题。
进入21世纪之后,随着互联网和数字化环境的不断发展,数据驱动范式的作用日益显现,并逐渐得到广泛运用。总体说来,数据驱动范式借助于统计分析、数据挖掘和机器学习等手段,从数据入手,直接发现特定变量关系模式,形成问题解决方案。在数据驱动范式下,研究发现的一类重要关系模式是关联及其扩展形式(如关联规则、相关性关系、模式关联等),并广泛应用到许多领域(如拟合、预测、模式识别等)。近年来兴起的深度学习中的一类主流方法(如深度神经网络)也是数据驱动的,旨在“输入—输出”变量间建立关联,不过其技术方法自身具有“黑箱(Black Box)”特点。在此意义上讲,这些数据驱动的技术方法在揭示因果关系及可解释性方面存在局限。
陈国青接着指出,其实,经济管理决策既需要关联也需要因果,这在一定程度上带来了经济学和管理学在研究范式上的挑战。鉴于此,探索新型研究方法论范式显得尤为重要。陈国青介绍了近年来凝练提出的一类新型范式,即“大数据驱动范式”。“大数据驱动范式”具有三个要素特征:外部嵌入、技术增强、使能创新。外部嵌入是指通过引入外部视角,将大数据提供的、传统模型视角之外的一些新的重要变量引入到模型的变量集合中。通常新变量的引入将导致构建新型变量关系。技术增强是指通过机器学习等新型技术方法和工具将引入的新变量(如视频、语音、文本、图片等多模态变量)融入变量集合,并支持新型变量关系的构建。使能创新是指通过构建新型变量关系,形成大数据驱动的价值创造。这个过程往往也需要技术增强,如因果推断、函数拟合、可解释性人工智能等方面的技术使用和创新。这里,新型变量关系的形式可能是原模型的简单变量增拓(如简单线性增拓),或需要探索与原模型不同的变量间映射关系。
在大会主题演讲之后的讨论中,陈国青还提到人工智能发展应用带来的一个重要动向,就是人与机器(如智能机器人和智能系统)的关系问题。随着机器越来越频繁地成为决策主体,机器行为引起关注,进而将对于经济学和管理学的许多方面产生深刻影响。从传统社会科学中的心理、认知和社会网络,到管理学中的消费者行为、人力资源和组织行为,到经济学中的效用函数、理性假设和市场参与者等,都是关于人及其活动的认识。当机器加入进来之后,人机共存形成了新的场景。此时,传统的以人为对象的一系列理论方法需要被重新审视,同时也使得新的理论方法拓新具有了广阔的空间。
2022年6月25-26日,中国留美经济学会(CES)2022年会“大数据、人工智能与经济发展:经济和管理的融合(Big Data, AI and Economic Development: Merging Economics with Management)”于线上平台举办。本届年会为期两天,分为四个主会场和70个平行分会场,累计500余人次海内外高校和研究机构的学者和员工参与。
供稿:发展规划与科研办公室