前沿译文 | ITIF:数据的价值取决于使用方式而不是存储地点
作者
Nigel Cory
编译
对外经贸大学金融科技实验室
编者按
所谓“数据本地化存储”(data localization),即一国政府限制数据流出国境的法律政策。截至2016年,从加拿大、澳大利亚、欧盟成员国到俄罗斯、尼日利亚、印度,全球已经有60余个国家做出数据本地化存储的要求。
网络安全是数据本地化最重要的正当化理由。但是,如果不能充分认识到数据本地化可能带来的经济损失和社会代价,我们就不能在全面把握数据本地化成本收益的基础上,做出恰如其分的决策。信息技术与创新基金会(ITIF)这篇文章从更广泛且更深入的角度揭示出数据本地化在安全之外的另一面。
须知,在数字经济时代,数据天然地想要跨境流动,因为数据如水,流水不腐,生生不息。
——对外经贸大学数字经济与法律创新研究中心主任许可
(英文原文请见附件)
关键要点:
1.强制在国内存储和处理数据并不能推动经济发展。政策制定者应该专注于帮助人们和企业收集、分析和使用数据,以提高创新、竞争力和生产力。
2.“数据本地化”政策只能减少数据中心就业,提高了成本且限制了信息和通信技术(ICT)产品和服务,最终造成经济损失。
3.正确的战略是鼓励广泛采用ICT;降低ICT的人工成本;改善数据创新基础设施;最大化可重用数据的供应;并培养员工在数据科学和数据素养方面的技能。
概览
随着世界各地的政策制定者努力应对利用数字技术推动发展的挑战,许多人被误导性的谬论所欺骗,以为数据的位置至关重要,从而强迫企业在本国存储数据,他们误以为这样做才能最好地为其经济服务,这一概念被称为“数据本地化”。实际上,信息和通信技术(ICT)的采纳、教育、数字基础设施和数据治理政策等,才能促进数据和数字技术的经济和社会效益最大化。
对于消费者和公司而言,数字技术从根本上改变了他们的贸易方式和商业行为。消费者依靠数据和数据驱动的服务在线搜索、在电子商务平台上购买和销售商品和服务、发送电子邮件以及任何其他任务,其中许多任务可以在功能越来越强大且价格合理的计算机、平板电脑和智能手机上完成。与此同时,企业几乎在所有行业中使用信息和数字技术——不仅仅是“技术”部门——来简化业务工作并提高效率。企业依靠数据来宣传和吸引客户、识别市场需求并相应地调整产品和服务、运营生产系统、管理全球员工、监控供应链,并实时支持现场产品。
但是数据的价值最大化需要跨越边界。正如ITIF在“CrossBorder数据流在所有行业中实现增长”所论证的那样,今天,运营、供应商、客户在好几个国家的公司,没有不依赖于数据的跨国界传输。此外,没有一项国际贸易能在不收集和发送某些个人数据的情况下发生。
对于所有国家,当个人和公司可以参与数字活动,而不对他们如何使用和转移数据进行不必要的限制时,经济是最具生产力和创新性的。不幸的是,许多政策制定者为了支持数字化发展,对公司存储数据的地方施加地理限制。还有出于其他原因进行数据位置的限制,例如解决隐私和网络安全问题,或确保政府机构可以访问数据进行执法,或为了国家安全目的。
无论基本原理如何,数据本地化不仅使企业跨境传输数据变得更加困难,甚至更加昂贵,而且还会增加云计算服务的成本。正如经济民族主义可能导致企业生产力下降和消费者成本上升,特别是当它专注于资本品时,“数据民族主义”政策将通过限制一个国家从数据驱动型创新中受益的能力,并且增加ICT产品和服务的成本,这将导致创新减少和生产率增长放缓。
本政策简报概述了为什么政策制定者不应被数据本地化的欺骗性言论所诱惑,而应将重点放在收集、分析和使用数据以改善创新、竞争力和生产力的政策上。
强调数据的存储位置是错误的政策
许多政策制定者错误地认为,要求在国内存储和处理数据(即数据本地化)是通往高科技工作、投资和创新的捷径。这是一种新形式的保护主义,类似于各国用关税来保护本国制造业。鉴于传统的贸易保护主义工具,如关税,在数字经济活动中不那么容易,追求数字重商主义的国家正在恢复“后边境”规则和技术要求,如数据本地化。
这些数据本地化政策的好处基本是假想,包括对就业的刺激,都是不正确的。政策制定者强迫公司将数据存储在本国的一个理由,是将创造更多国内数据中心的就业。事实上,对就业方面的影响恰恰相反。数据中心是典型的高度自动化,使用人工智能,只需要少量员工来操作大型设备。2015年,对美国各地数据中心运营的调查中,CBRE数据中心解决方案集团(一家美国房地产公司)估计,典型的数据中心可创造5-30个永久性工作岗位。例如:
1.微软位于华盛顿州昆西市的数据中心在施工过程中一次有多达500名工人,但现在只雇佣了50名全职员工来运营该中心。
2.2011年,苹果在北卡罗来纳州建立的价值10亿美元的数据中心在安全和维护等领域仅在当地社区创造了50个全职工作岗位和另外250个支援工作。
3.2016年,谷歌在俄勒冈州的一个数据中心投资了12亿美元,但仅招聘了175名员工。
4.在2018年,Facebook开始在犹他州建立7.5亿美元的数据中心,一旦完成,将全职雇用30-50人。
政策制定者应该意识到,数据中心的客户需要根据市场因素自由决策,不应该被政府强迫购买本地数据中心的服务。数据中心运营商可以开放新设施,来满足对数据相关服务的大量且不断增长的需求,并且更接近客户来提供改进的服务(例如,减少执行存储或检索数据的指令所花费的时间的延迟),或利用廉价可靠的电力(对数据中心都至关重要)。在这种情况下,各国应通过解决影响其在市场中运营决策的商业环境和监管条件,确保该国有强大的光纤通信中枢系统,来吸引数据中心和其他ICT公司(国内和国外),而不是强制他们行动。
许多国家的政策制定者正在努力解决“数字鸿沟”,即可能因缺乏技术获取而导致的社会和经济劣势,但基于数据本地化的数字化发展战略将对解决该问题无济于事。事实上,这种方法不仅错误,而且对一个国家发展创新能力有害,因为它可能会影响ICT服务的价格、可用性和范围。例如,越来越多的文献表明,数据本地化政策增加了云计算服务的成本,云计算服务对经济的生产力产生了更广泛的影响,因为它影响了这些IT服务的所有用户。
Leviathan(一家信息安全公司)在2015年进行的一项研究表明,如果数据本地化政策将这些云服务从最具成本竞争力的全球云提供商处切断,那么本地公司可能需要为巴西、欧洲和其他地方的云服务支付更多费用。来自国际治理创新中心(CIGI)和Chatham House 2016年的研究表明,在巴西、中国、欧盟、印度、印度尼西亚、俄罗斯、韩国和越南,限制性数据法规(包括强制数据本地化)可能导致价格上涨和生产力下降。同样,欧洲国际政治经济中心(ECIPE)已就欧盟、俄罗斯、巴西、中国、印度、印度尼西亚、韩国和越南的数据本地化和数据监管成本进行了多项计量经济学研究。
支持数据驱动型创新的建议
提供国家数据政策方面的详细议程超出了本简报的范围,但以下建议仍可为政策制定者提供一些建议,包括:减少或消除与数据相关的商品和服务的人工成本;专注于从数据中获取洞见而不是试图在本地存储;改善支持数据创新的基础设施;最大化可重用数据的供应;并在工人中发展数据科学和数据识别技能。
降低数据服务的人工成本
成本是消费者和企业采用信息通信技术的主要动力,因为价格上涨通常会导致需求下降。ITIF在“政策制定者促进ICT采用指南”中概述了ICT产品的这一案例,但该原则也延伸到数据相关服务。
成本应该是一个核心问题,因为基础设施——互联网接入和智能手机——仍然影响着全世界数百万人。政策制定者应致力于取消ICT进口关税,消除对ICT产品和服务的歧视性税收,并确保用户可以从世界任何地方购买最佳技术(例如,取消当地内容要求,限制外国直接投资, ICT产品和服务的限制性认证或许可安排)。ITIF在“如何加入信息技术协议促进发展中国家的增长”报告中的模型表明,发展中国家通过削减ICT关税而获得的经济增长创造了可以大幅抵消关税收入损失的税收收入。
关注成本和可访问性至关重要,因为对于许多国家而言,数字发展的主要收益来自于尽可能多的采用率和使用现有的ICT设备、计算机软件和云服务。这样做可以帮助他们提高效率,更好地收集,访问和分析自己的数据或来自第三方服务的数据。特别是,世界各地的公司可以远程访问和相对低成本使用,可扩展且功能日益强大的基于云的数据存储和分析服务(例如提供基于云的人工智能服务的服务),而不必自己投资昂贵的ICT设施。
政策制定者应优先考虑鼓励广泛使用这些ICT产品和服务的政策。这就是如何实现最大的社会和经济收益,而不是通过实际生产ICT产品和服务。(这并不是说政策制定者不应该支持当地创业公司和技术公司,而是最大的经济收益将来自帮助经济的所有部门使用更多更好的ICT产品和服务。)对于发展中国家的农民来说,本地生产的更昂贵但功能更少的智能手机对用于检索天气、作物和价格信息没有帮助。同样的前提延伸到一个国家的大部分经济活动,与实际科技生产力无关。
信息通信技术在这个方面特别重要,因为它是支持经济生产力的关键“通用技术”。回顾1987年至2002年间发表的关于信息通信技术和生产力的50多项学术研究,Dedrick, Gurbaxani和Kraemer发现,“在公司和国家层面,加大对ICT的投资与提高生产率增长有关。”
事实上,几乎所有从20世纪90年代中期开始的学术研究都发现ICT具有重要意义,对生产力有积极影响。事实上,在不同的经济层面和经济部门上,从企业到行业,再到整个经济,以及在产品和服务生产行业,都发现了信息通信技术对生产率的积极影响。
最大限度地提供可重用数据
为了促进数据的可用性并鼓励企业使用数据,决策者应该避免制定禁止数据供应和流转的法律法规,例如过于繁琐的数据保护规则和数据本地化政策,并且增加数据供应,例如通过开放数据和信息自由政策。
制定更限制性的数据隐私或监管法律相当简单,但制定此类法律以对用户和企业产生最小的破坏性影响,这要复杂得多,这就是为什么各国在相关数据法律法规中将创新作为一个明确的结果。同样,决策者应避免过多地限制数据创新效益,例如在网络浏览器中使用cookie这一不必要规则,人工智能应用程序的错误要求以及数据实时共享的限制,例如在紧急情况下共享汽车数据。决策者还应审视数据共享法规可以豁免的地方,以便有益地使用数据,例如放宽使用人工智能和医疗数据的法律限制。
就生成和访问数据而言,很多数据无处不在,成本低廉且广泛可用。整个数据代理行业都依赖尽可能多的数据生存,并将其出售给发现数据有价值的公司。其他数据,如卫星和基因组数据,获得成本可能昂贵但不是排他性获得的,而且分享起来相对便宜。例如,欧洲航天局和美国国家航空航天局都在绘制受艾赛飓风影响的地区(已在非洲造成数千人死亡),以便向地方当局提供最新信息,以帮助他们开展救援工作。作为使用数据带来环境效益(除了经济和社会效益)的一个例子,研究人员使用大型犀牛DNA数据库起诉偷猎者和交易犀牛角的人,而在另一个案例中,一家巴西公司开发了远程监控系统,使用传感器和机器学习来帮助公司和研究人员跟踪和预测森林的健康状况。
但是,决策者还应该了解他们如何适当实施政策以保护数据的产生和使用。例如,欧盟通用数据保护条例(GDPR)第20条赋予数据主体数据可移植的权利,它提供的一个模板,给数据生成机器(如汽车)的运营商提供了一个类似的访问和分享非个人数据的权利。使用开放式应用程序编程接口(API)(例如欧盟新的支付服务指令(PSD2)规定的那些)可以很好地支持这两项权利,因为它们允许客户与第三方共享其数据以换取新服务。
同样,除了对ICT基础设施的投资(详见下文)之外,决策者还可以鼓励开发、部署支持数据创新的关键技术平台,如数字公共服务、智能电表和智能城市。例如,物联网可以在公共基础设施中产生重要数据。道路和公共交通网络中的传感器可以测量拥堵状况并指示如何使用服务,从而实时向维护团队报告问题以更好地长期规划。同样,智能电表能够更好的观察家庭和企业能源使用状况,从而支持新的数据驱动的电网管理方法。
最大限度地提供可重用数据也是为了让更多的公司使用ICT来生成、收集和分析数据(这使我们回到成本问题上,将成本作为数据部署和采用的动力)。使用ICT服务的企业数量越多,他们可以生成、收集和分析的数据越多,以提高效率并推动进一步的研究和开发。为促进研究和开发,决策者应专注于解决影响企业大数据使用能力的问题;专注于云计算;专注于用于跟踪和整理库存、建筑物和其他有形资产的射频识别技术;专注于帮助组织业务流程的企业资源规划工具;专注于客户关系软件来分析数据。
事实上,除了通过更多地采用和使用数字技术来弥合“数据差距”之外,决策者需要减少“数据差距”可能由于缺乏收集或使用有关个人或社区的数据而导致的社会和经济不平等。国家中的某些群体由于居住地的原因所以没有收集有关他们或他们社区的数据,此时数据差距已经存在。如果这种数据差距的趋势继续下去,可能会引起“数据沙漠”(data deserts),指的是一个国家的地区,其无法获得可用于产生社会和经济效益的高质量数据。为了确保所有人都能获得数据驱动型创新所带来的巨大利益,并且没有任何群体在系统上处于不利地位,决策者应该采取措施,例如建立集中于难以接触的人群的政府数据收集计划;确保旨在缩小数字鸿沟的供资计划考虑对数据贫困的影响;确保数字扫盲计划帮助个人理解数据生成技术,例如社交媒体和物联网;并鼓励一些群体的领袖了解数据的好处(这些群体在社会中并没有充分地被代表),知道如何将技术解决方案与社会发展计划相结合。
政府机构还可以通过“开放数据”法律法规来支持基于数据驱动的创新,这些法律法规有助于访问和使用大量的数据。通过开放数据,政府机构可以更好地评估以及在内部共享数据,和其他机构一起改善整个政府的决策;公众可以快速、轻松地访问大量政府数据;私营部门可以建立和改善新产品和服务,以促进经济发展。实现这一目标的方法之一就是通过公私合作,因为许多政府机构持有有价值的数据,但不一定拥有将数据投入使用的人才或资源。相比之下,企业可能拥有创新数据所需的人才和资源,但却无法获得某些政府资源。已经有多个使用这种方法的国家,决策者可以效仿他们。关于政府如何发布和使用开放数据进行问责、创新和社会影响,开放数据调查部门(The Open Data Barometer)提供了全球性的衡量办法。但是,它显示了一些国家如何不采用开放数据政策框架,而且有大量国家没有任何开放数据政策。
与此相关的是,决策者还可以变更政策来指定公司使用现代的,机器可读的数据标准作为政府监管文件的一部分(而不是老式的、非结构化的PDF或HTML格式的文档),以便它可以更容易被政府和公司分析和使用。举个例子,2009年,为了提高监管备案数据的效用,美国证监会(SEC)要求上市公司使用结构化、机器可读的可扩展商业报告语言(XBRL)。XBRL格式使财务数据更有价值,因为它允许SEC、公众、投资者和其他利益相关者轻松搜索,自动分析这个信息。
专注于从数据开发而非数据存储
数据本地化策略以错误的假设为前提,即数据的位置对最大化数据价值至关重要。但是实际上它没有这么大的重要性。数据经济的成功取决于企业和个人如何有效地利用数据获取信息并且挖掘价值。
决策者应该关注,如何帮助当地公司从数据中生成和创造价值。企业将数据价值最大化的最佳方法因企业组织而异。(参见数据创新中心的报告“100数据创新。”)例如,GE和西门子正积极致力于一项服务,该服务能够收集和分析其销售机器的数据。IBM正在从健康记录、医学成像、索赔和遗传学中整合数据,以改善它的Watson Health分析服务。汽车公司使用互联车辆数据来改善他们的车辆。超市连锁店使用购物卡的数据提供个性化折扣;他们现在希望利用第三方的额外数据来更好地促进这些促销活动并与廉价品牌竞争。整个行业,如医疗保健、农业和消费品行业,正在迅速转向越来越多地收集有关其客户和产品的数据。
通过这种方式,企业如何将数据汇总到“大数据”中,通常是最有价值的。例如,虽然拥有关于某一汽车的位置和速度的数据可能很有趣,但除了驾驶者(可能还有他们的家人)之外,它并不是那么有价值。但是,从大都市区的数万辆汽车中积累数据并将其显示在地图上(例如,Waze)是非常有价值的,因为它为游客和现场急救员提供有关交通状况的实时信息。数据在组合时更有价值的另一个原因是:培训数据库越大,机器学习算法通常越有价值。这就是为什么许多企业只有在能够自由跨境流动时才能使数据价值最大化的部分原因:他们从各种内部和外部资源收集数据,并使用云分析平台对其进行全面分析。例如,正如疾病不会停留在国界,寻找疗法所需的数据也需要越过边界。应用于更大的全球数据库的强大数据分析可以有助治疗的加速发展。疾病越罕见,建立更大的数据库就越重要。这也是为什么政策制定者寻求支持数据驱动型的创新应该最大限度地利用可重用数据,而不是给跨境数据流设置障碍的另一个原因。
在考虑如何支持数据驱动创新时,政策制定者需要了解其他一些关键原则。首先,数据是非竞争性的,这意味着一个人或公司使用并不会降低其对其他用户的可用性。相同的数据可以支持创建几个新的产品、服务或生产方法。例如,一个企业收集用户年龄和位置并不限制另一个企业也这样做。因此,政策制定者的目标应该是鼓励许多公司“丰富数据”,而不是担心数据是有限资源,必须均匀分配。
其次,企业从数据中获得的大部分价值不是来自单个数据点,而是来自集体数据,例如汇总用户数据。这意味着政策制定者应该鼓励数据共享以及数字平台的开发,以便收集和分析大规模数据库。由于这些数字平台的价值随着用户数量的增长而增长,表现出经济学家所谓的“网络效应”,政策制定者不应对这些平台施加不必要的限制,例如通过人为限制其规模。政策制定者应该看到这些支撑数字经济的概念,看到它们是有益的,因为它们通过降低成本和提高价值来增加消费者福利。
改善支持数据创新的基础设施
基础设施是数字发展的首要问题,因为互联网依赖于它进行连接。改善信息通信技术基础设施的因素很多,特别是在发展中国家。这就是为什么联合国和世界银行正在把重点放在信息通信技术基础设施上,进一步努力提高数字发展和数据驱动创新。
显然,提高互联网普及率和速度对于数据驱动创新和数字贸易至关重要,因为光纤网络不足,将导致较差数据服务质量和覆盖率不一致,阻碍了城市和农村地区移动互联网服务的普及。如果市场未能充分服务于人口稀少的地区,政府应该通过直接投资和领导力介入公私合作伙伴关系,缩小差距。在可能的情况下,各国还应该在国际层面上集中他们的移动频谱划分权,因为这将允许开发集成的泛区域无线宽带网络,并降低单一市场中不必要地重复成本。
政策制定者应该考虑他们可以改变哪些政策,消除哪些障碍,以加快下一代无线和有线基础设施的部署。在某些情况下,政策制定者可能会发现,不适合现代网络部署的传统低效流程可能会延迟或阻碍宽带服务的推出,随着各国正尝试向下一代无线服务过渡,这将成为一个很大的问题。
提高民众的数据科学及数据认知技能
数据创新不是偶然,而是人们创造的。数据经济的成功需要能够运营最新技术和流程、分析复杂数据集的劳动力。所有国家的政策制定者都面临着通过其教育系统和专业培训计划鼓励发展这些数据相关技能的挑战。
公司既需要基层工人,也需要高级技能工人。为了充分利用数据驱动技术,公司需要具备专业知识的ICT专家来部署此类技术,将其与公司的业务流程相结合,并培训员工如何使用这些技术。一个关键指标是一个国家的科技毕业生的数量,因为这提供了具有数据经济相关技能的毕业生数量的粗略估计。另一个关键指标是某些国家提供的数据科学学位课程的数量,因为这可以代表国家的高等教育系统如何吸引和教育那些对数据科学感兴趣的人,以及该国专业人员在该领域进行额外培训的要求。
然而,除了信息通信技术专家外,公司还需要其他员工学习必要的信息通信技术技能,以便整个企业正确使用数据。对于那些希望成为外包技术服务工作中心的国家,如印度和菲律宾,这一挑战尤其严峻。
本文首发于微信公众号:数字经济与社会。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:季丽亚 HN003)
上一篇:冲刺!高考语文135的秘籍,各题型答题技巧+公式(上),手慢无
下一篇:2018年天津考研初试成绩查询时间:2月4日10时
最近更新职业教育
- 加强行刑衔接协作 合力守护绿水青山
- 名单公布!南昌31名学霸上榜!
- 北京有车型优惠超10万元,南阳有门店贴出“国货惠民价7.59万元起”海报,合资车
- 事业单位编外人员转为雇员制行不行?银川市人社局回复了这份提案
- 老师曝光教室无窗帘被约谈 校长停职、教室已全部安装窗帘
- 大祥区中小学心理健康教育教师能力提升培训圆满结束
- 最美家庭展播二:梁芳清家庭
- 王晓龙谈国内青训:我们只有初中水平老师,教不出大学水平的学生
- 11月起 四川学业规划行业有了“国家标准”
- 河南2023年度全省职称评审工作开始
- gre数学有哪些备考方法
- 最优模型估算:祁连山国家公园青海片区雪豹种群数量为251只
- 家庭教育公开课第八讲 | 关爱青少年心理健康
- 重磅消息 | 第十二届商学院数字化论坛即将启幕!
- 《志愿军:雄兵出击》发布路演特辑
- 建筑“黑科技”闪耀长沙筑博会
- 为青春点赞!你最喜爱哪支广东青年大学生“百千万工程”突击队?
- 扬州各学校开展形式多样的庆祝活动 喜迎建队日争做好队员
- 深圳发布农贸市场综合治理第三轮测评结果 低于80分市场数量大幅度减少
- 2023下半年湖南英语四六级考试时间安排
- 朝阳营商环境考评成绩连续五年居全市第一
- 小米 14 表现如何?数据库实测性能续航充电等
- 发表SCI论文,申请专利,青年标兵……她是曲园学子李雯鑫
- “湿”意盎然的生态答卷丨马鞍山:水清岸绿 石臼湖风光美如画
- 「一线新动态」十年深耕涉外高端电力人才培养,“电力工程师的摇篮”助力“一带一路”