网络舆情是否影响股市行情?基于新浪微博大数据的ARDL模型边限分析

时间:2018-09-10 编辑整理:陈云松 严 飞 来源:早发表网

  要:本文基于新浪微博大数据,分析互联网上的股市舆情是否影响真实世界中的股市行情。在梳理网络舆情,特别是微博影响股市的机制的基础上,我们利用具有“利好”和“利空”含义的股市术语的微博出现词频(“热词指 数”),生成股市的“微博信心指数”。“格兰杰因果检验”和“自回归分布滞后模型”(犃犚犇犔)边限检验表明:在股市震荡期,早前三天内的“微博信心指数” 有助于预测上证指数;“微博信心指数”和“上证指数”存在正向相关的均衡关系;在股市行情平稳期,以上的统计关联并不存在;网络舆情通过影响入市资金流进一步影响股市行情。

关键词:股市微博 大数据网络 传播时间 序列分析

 

舆情如何导致一定的经济、社会或政治后果,是新闻传播学与社会学、经济学、政治学的交叉领域。互联网,尤其是Web2.0的快速发展,进一步提升了舆情传播对经济社会过程的影响能力。尤其是微博、 微信等新网络平台的出现,使得虚拟空间中的信息传播具备了对真实世界更为快速和深刻的渗透力。从社会学的角度看,微博等新网络媒体平台实际上已经成为观察当代社会微观层次的个人决策何以一跃成为宏观层次社会现象的重要途径,为社会科学理论化的跨层次研究提供了重要工具(Coleman1986)。

 

在经济生活中,股市行情的深刻变化影响着人们的日常生活,而网 络舆情对股票市场的影响也日益凸显。不仅投资者在各式各样的股票 论坛和包括微博在内的网络平台上通过日常的交流讨论进行投资判断,上市公司也越来越多地利用网络平台在第一时间发布公司信息,帮助决策者进行投资判断。这种发展变化促使我们去思考:网络舆情如 何影响股市行情,并且这种影响又如何在社会学层面上得到解释。另一方面,由于中国股市中机构在投资者中所占比例较小,且市场信息披露机制和监管手段不够完善,因此,投资者之间信息不对称现象比较严重(赵涛、郑祖玄,2002)。这进一步使大量股市投资者,尤其是散户既依赖正式渠道的企业信息披露(曾颖、陆正非,2006),也更容易被非正式渠道的网络信息影响。

 

在本文中,我们旨在分析以微博为载体的网络舆情对股市行情的 影响。海外的相关研究表明,在和微博类似的推特(Twitter)平台中, 用户在投资领域的集体情绪倾向和美国“道琼斯指数”的总体涨跌高度相关(Bollenet.al2011)。国内的相关研究也在金融和传播等不同 领域取得重要进展。不过,囿于数据,现有的国内研究或将视野集中于某个(些)股票的个体行情(史青春、徐露莹,2014;张栋凯、齐佳音,2015),或仅仅分析采集自某个财经网站及论坛的局部舆情(金雪军等,2013;易洪波等,2015)。而本文试图从微博总体舆情和股市总体行情 的宏观层次把握传播与经济现象的关联。

 

我们强调,和领域专业、受众较少且异质性低的单个财经网站或论坛不同,微博平台具有前者远远不及的开放、实时、影响面广、使用者异质性强的重要特征(谢耘耕、荣婷,2011)。正是这种人人都是自媒体的碎片化特征使微博中的股市信息代表了足够“大”的样本,代表了海量 股民的心态、观念和决策信息,也因此,微博舆情更适合作为全社会心态的间接测度。而微博中带有明确利空和利好导向的热议,从逻辑角 度更可能对真实的股市走势产生影响。而某个网站或论坛中所反映的 投资舆情或讨论偏好,即便在统计上存在与股市行情的关联,在因果机 制上也较难作为舆情影响行情的真正案例。因此,在前人研究的基础 上,我们把网络舆情的载体从单个的网站或论坛拓展到可以代表社会 舆情的微博空间,把分析视野从股票个体行情、局部行情,拓展到股市全局。

 

我们将使用新浪微博这一国内规模最大、最具代表性的微博平台作为舆情数据来源。利用具有“利好”和“利空”不同含义信号的股市术 语,我们构建股市每日“微博信心指数”,并将其与每日“上证指数”进行 时间序列分析。我们使用了基于“Today-Yamamoto”过程的“格兰杰因果检验”和基于“自回归分布滞后模型” “Autoregressive  Distributed  Lag. ARDL” “边限检验的协整分析”(Bounds Test using Autoregressive  Distributed  Lag. Model ),以观察微博舆情是否真正影响股市行情。考虑到舆情影响决策过程的复杂性,我们分别对股市“震荡期”和“平稳期”进行分段考察。本文是利用大数据对虚拟空间舆情影响真实世界 经济社会结果的实证分析,有助于我们从宏观层次上进一步理解传播对于经济社会过程的重要影响。

 

一、文献回顾

 

(一)网络舆情影响股市的实证文献

 

随着信息技术的不断发展,网络信息的扩散模式以及投资者在网络社交媒体上的互动行为都愈发对股票市场的波动产生影响。一般而言,人们在做出决策前都会预设一个参考标准,然后衡量每个定的结果与这个参考标准的差别有多大,如果预期与标准状态的差距越大, 人们就越倾向于做出正向的决策。在投资领域,当投资者对于市场的 期待认知越高,就越可能选择忽略负面消息或对正面消息产生过度反应,导致股价被高估,市场成交活跃;当投资者对于市场的期待认知越低,就可能选择忽略正面消息或对负面消息产生过度反应,导致股价被低估,市场成交低迷(De long et al1990Fisher and statman2000Brown and Cliff2005)。也就是说,投资者情绪可以影响个股的波动率。即当利空发生时,投资者情绪低迷会导致股票市场波动率减小;而利好发生时,投资者情绪高涨就会导致股票波动率增大。

 

在国际研究中,卫索基(Wysocki,1999)对雅虎财经论坛帖子提及数量最多的50家公司进行分析后发现,帖子数量的确能预测次日股票 的交易量和超额收益。特玛钦和 魏特劳(Turmakin and Whitelaw, 2001)分析了怒牛(Raging Bull)股票论坛中异常发帖量和内容倾向变化与股市异常交易量、异常收益的统计关联。安特卫勒和弗兰克 (Antweiler and Frank,2004)从雅虎财经论坛帖子中生成看多、持平及看空的投资者情绪指数,发现其对“道琼斯指数”波动具有预测能力。 戴斯和陈(Das and chen,2007)利用语义分析方法从一个股票论坛中提取出中小投资者的意见以生成投资者情绪指标,并发现这一指标与股市行情存在关联。除了论坛,网站新闻也具有对股市行情的影响。例如,梁勋(音)(Liang2005)发现,雅虎、怒牛和精财(Smart money)等 三家财经网站上股票新闻内容和数量与相关股票的收益率、价格波动和交易量均存在关联。

 

在国内研究中,周翠玲、邹高峰(2013)针对新浪财经股票论坛的帖 子内容构建投资者乐观情绪和意见分歧指数,发现这些指标对IPO抑价及交易量有显著影响。另外三组针对同一个股票专业论坛——东方 财富网股吧——的实证研究则证实,投资者在专业论坛的帖子对于股 市和股票有众多影响。其中,林振兴(2011)发现,投资者对一个股票的 关注度与其IPO抑价显著正相关,并且与上市首日换手率也显著正相 关;而金雪军等(2013)发现,论坛发帖量对股票的市场成交量和相关股 票收益率有显著的正向影响,投资者在论坛讨论中所表现出的看涨情 绪对第二日的股市收益率具有预测作用;易洪波等(2015)进一步发现, 投资者多空双方的情绪对交易市场成交量和收益率存在非对称影响, 投资者空方情绪比多方情绪对市场成交量的影响明显;孔翔宇 等 (2016)利用数据挖掘技术,发现新闻中的国际贸易以及城市化相关主 题与股市变动关系密切。

 

不过,以上这些研究大多针对某个或几个网站,特别是针对专业论 坛进行。而新近的国际金融研究开始把分析对象从单一的网站和论坛 转到代表更为广泛舆情的类似微博的自媒体平台。针对推特的研究表 明,推特用户在投资领域对某个股票的集体情绪倾向指标可以预测该股票的收益率(Sprengeret al.2013;Bartovet al,2015),而且这种 关系对于小股票或小公司更为明显。此外,国外相关研究开始从宏观 层面对推特情绪与股市总体行情进行关联。研究发现,推特中的集体 情绪倾向指标可以预测第二日美国“道琼斯指数”的涨跌,预测准确率达到87.6%(Bollenet al .2011)。此外,推特情绪还和股市成交量波 动密切相关(Zhanget al .2011)。更重要的是,推特中前一两天的26 个财经词汇出现词频和后市美国股市总体收益率显著相关(Mao et al .2011)。这意味着,推特中的舆情,特别是术语热词,对股市行情所有影响。

 

现在,国内研究也开始对微博舆情与股市行情的关联有所关注。 例如,张栋凯、齐佳音(2015)分析了味千(中国)“骨汤门”事件中微博舆情对该股票的负面冲击。不过,现有的研究既少且仅仅关注某支股票的个体行情,未能展示代表社会舆情的微博与股市总体走势的宏观层次关联。

 

我们强调的是,和领域专业、受众较少且用户同质性单一的单个网站或 BBS论坛不同,微博社交平台具有前者远远不及的开放、实时、影响面广、使用者异质性强等重要特征,因此,微博舆情更适合作为全社会心态的间接测度。微博中带有明确利空和利好导向的股市热议,从逻辑角度更可能对真实的股市走势产生影响。此外,恰恰因为微博在一定程度上能对社会总体舆情有所代表,因此,用微博舆情和股市总体走势进行关联是值得重点关注的研究领域。

 

(二)股市术语与舆情信号

 

现有文献对舆论的看涨或看跌情绪主要是通过帖子的字面含义来界定并计算,可利用人工判断或辅助以计算机学习的方式来进行(金雪军等,2013)。本文主要利用微博中股市术语的市场信号来构建社会舆 情指数。股市术语指的是股票市场的专有名词。无论是微博还是其他 媒体,凡是和股市有关的讨论,都必然大量使用这些术语。重要的是, 不少股市术语本身带有明显的行情判断信号。我们认为,对于在微博 上被海量热议和大量提及的股市术语,用词频统计的方法可以构建整 个微博中关于股市走势的总体判断。

 

一个显而易见的问题在于,某个词汇带有明显利好和利空信号,并不意味着这个词汇所在的语句和帖子本身具有完全相同的信号。例如,“现在可以建仓”和“现在不能建仓”,虽然都使用“建仓”这个关键词,但含义显然完全相反。因此,词频似乎不能代表舆情的指向。此 外,即便是用人工解读来取代词频统计似乎也不能解决这个问题。由 于互联网的匿名性和虚假信息惩戒机制的缺乏,理论上人们无法可靠 地判断发布者本身是否带有其他目的。例如,试图出售手头股票的发 布者,可能会散布虚假的利好信息,也因此同样一则消息会有截然相反 的市场预期解读。因此,字面含义明确的关键词,其在宏观层次上的统 计量(例如,词频加总)是否仍然能构成表达同样信号的指标?

 

根据微博传播的特点,我们提出分析层次、语法结构、测量方法和文献证据等四个方面的理由。这些理由使我们可以利用被海量热议且信号明确的股市术语词频构建舆情信心的指标。

 

第一、分析层次方面。被大量热议的术语,本身就能够直接体现舆 情对市场的基本判断和共识。例如,“股灾”一词,当置于单个句子的微 观层次中时,我们无法判断其代表的信号方向。但如果“股灾”被大量 讨论,在宏观层次上就映射股市已经出现持续下跌。换句话说,即便是 在大家纷纷争论2015年6月份的股市动荡是不是“股灾”时,不管是支 持者还是不支持者,其对行情的判断仍然具有基本的共识:起码此时股 市处于下跌的走势。同样,“建仓”一词的反复出现和海量热议意味着 市场已经不再最高点。实际上,在推特中,学者发现推特语句的含义可以用关键词直接代替(Yanget al.2012)。

 

第二,语法结构方面。互联网,特别是微博的文本,往往在语法上 具有直接和明晰的特点。这一特点主要来自微博对文字长度的限制和移动互联网设备的普及。换句话说,发微博有文字限制,在移动设备上输入文字又不方便,这导致人们在微博上表达一个意思的时候,更倾向于使用直接句式,而不是否定句式。为支撑这一推测,我们专门对本文所使用的微博股市术语做了分析。例如,我们发现,以“抄底”为例,“不抄底”“不能抄底”“不要抄底”占“抄底”总词频总数的比例不到10%。 其他的重要术语也都存在这一特征。这意味着,大量的“抄底”热议就 是人们积极进场的信号。

 

第三,测量方法方面。即便无法完全证明具有看涨信号的术语词 频代表真实的看涨信心,我们仍然可以通过数学方法来尽量解决这一 问题。最直接的方式就是在量纲统一的情况下,把看涨术语总词频指 数和看跌术语总词频指数相减或相除。如果人们对看涨和看跌两类词 汇的否定式与肯定式使用比例是大致相当的,那么就可以通过计算差 或商的形式得到可以回避否定式表达的信心指数。基于这样一个工作假设,我们可以获得对舆情信心的测量并用于探索性分析。

 

第四,文献证据方面。近年来,不少金融和传播学实证研究已经证 明,基于词汇字面直接含义所构建的舆情信号指标和真实的股市涨跌 有正向关联。例如,在对谷歌检索的研究中,对“萧条”“破产”等词汇的 网络检索和后市看空显著相关(Daet al.2010);对“债务”一词的网 络检索和相关股票行情有重要关联,甚至可以用来预测后市(Preiset al.2013)。在对推特的研究中,研究者发现情绪关键词的词频和其字面所代表的社会情绪等高度相关(Kimet al .2013),人们常用语和各自在网络社区的层次身份高度相关(Brydenet al.2013)。在中国股市研究中,来自和讯网、新浪网等包含“债务”字样的新闻报道会从 负面影响相关股票的行情(Zhaoet al.2011)。这些研究结果均表明,单个或一系列带有明确市场信号的股市术语,其词频在宏观层次上和代表其字面含义的经济社会结果存在正向统计关联。

 

二、研究假说

 

通过微博传播的平台整合,原本分处不同地域、发布自不同时间、 来自不同个体的海量股市信息,会实时、高速、多层次地在全社会流布。 对微博所展示、传播和汇聚的大量碎片化消息和观点,个体参与者会进 行基于真实性的解读和判断,完成社会学习的过程,同时还会加入信息 发布行列。当从网络中获知的他人股票买卖行动或信息量达到一定的 门槛时,个体参与者就会做出新的股票买卖决定。在这个过程中,由于股市个体对自身掌握信息不足的认识,会进一步凸显所谓的“投资者情 绪”(investor sentiment):投资者情绪越高,个股行情就越高;投资者情绪波动越大,个股波动率就越高(张丹、廖士光,2009;游家兴、吴静, 2012;何平等,2014;刘维奇、闫汾娟,2014),从而使得网络舆情虽不至 于风声鹤唳,但对个体的信念更新和决策仍能产生重要的影响。


职称
论文

期刊
发表

加急
见刊

写作
咨询

课题
专答

编辑
顾问

关注
我们

返回
顶部