主页 > 生活

大数据在会计中的应用前沿

时间:2019-08-09 来源:袁园是先生
1

什么是大数据

大数据是指结构化或非结构化数据集,这些数据集通常根据四个“V”来描述:规模,多样性、速度和准确性。规模是指数据集太大;多样性反映了不同的数据格式,例如定量,基于文本和混合形式,以及图像,视频和其他格式;速度测量新数据可用频率,这种情况越来越频繁。最后,数据的质量和相关性会随着时间的推移而发生巨大变化,这被描述为其准确性。审计专业拥有大量且不断增长的数据,其种类和准确性不断提高。在线获得的文本信息是一种新型数据。审计人员也面临着越来越快的数据,特别是在实时信息的背景下。

大数据有多种形式 - “小p,大n”,“大p,小n”和“大p,大n”,其中n表示数据数,p表示变量数量。这些分类很重要,因为它们可以影响哪种技术最合适,例如,随机森林算法对于“大p,小n”问题特别有用。高频交易产生大量高速和高速度的大量数据集,为数据分析带来重大挑战。然而,这样的“小p,大n”问题可能是三种情景中最容易的问题,所使用的分析工具主要是现有统计技术的改编。 “大p,小n”情景最好的例子是基因组学。单个人类基因组包含大约100千兆字节的数据。数据基本上是非常长的窄矩阵,气候变化研究是大数据“大p,大n”情景最前沿科学的一个例子,在很长时间内从世界范围的网站网格收集多变量时间序列。


大数据还指用于从各种数据风格中得出推论的技术。 这些技术通常试图从数据中推断出非线性关系和因果效应,这些数据通常在信息中非常稀少。鉴于数据的性质,这些技术通常没有或非常有限的分布假设,计算机科学家从揭示完整记录中的模式的角度来处理大数据 - 这通常被称为算法方法。模式被视为数据集复杂性的近似值。相比之下,统计学家更倾向于将数据视为对基础过程的观察,并提取信息并对基础过程进行推断。


2

大数据分析技术

大数据中使用的统计技术需要更灵活的模型,因为高度结构化的传统回归模型不太可能很好地适应大数据。监督学习从具有已知结果的数据开发解释性或预测性模型,以应用于具有未知结果的数据。 一些流行的监督学习方法包括人工神经网络、分类和回归树(决策树)、随机森林、朴素贝叶斯、正则化回归、支持向量机和多元自适应回归样条。相比之下,无监督学习试图揭示未标记数据中的模式,流行的方法是无监督神经网络、潜变量模型、关联规则和聚类分析。机器学习是一个包含有监督和无监督学习的总体术语。

大数据技术也可以应用于传统的小型数据集,以获得更多的见解。有学者使用逻辑回归来分析审计任期和审计报告之间的关系,作者使用模型中的平方项来控制潜在的非线性关系,但这仍然强加了二次关系的约束。使用非参数大数据技术,例如决策树可以揭示任何非二次关系的存在。此外,使用这些技术中的任何一种产生的模型可以容易地可视化,传达和解释。


3

大数据在会计审计行业的应用

目前大数据在会计相关行业的应用场合主要有:财务困境建模、财务欺诈建模、股市预测和定量建模、审计。

财务困境建模中的研究论方中使用数据挖掘技术来检测并且预测公司的财务困境或财务失败,并且这些技术也会是会计和审计人员感兴趣的,以协助他们进行持续经营评估。

金融诈骗是全球组织和经济体的一个重要问题,金融欺诈建模上,可以帮助审计人员在进行欺诈风险评估时评估欺诈风险,但金融欺诈建模的最佳方法备受争议。

侧重于股票市场预测其他定量建模这一研究流程对预测分析特别感兴趣,并为管理者和投资者提供投资建议,而定量建模和股票市场预测,特别是使用在线文本信息和情绪分析的预测,是利用大数据技术的有用性的一个活跃的研究领域。

大数据情绪分析在审计方面具有潜在的应用价值。在线新闻,社交媒体和其他在线资源中出现的负面情绪可能会影响基于风险的审计。

摘译自Gepp A, Linnenluecke 和Neill,2017年的论文,《Big Data TECHNIQUES in Auditing RESEARCH AND PRACTICE: current trends and future opportunities》


欢迎关注西邮会计之声

我们一直在等你



相关阅读