构建大模型实现数据合规智能化

2023-12-15 16:01:07 来源：法人杂志作者：韩曜旭张露婷

韩曜旭张露婷

11月10日，北京数据基础制度先行区（下称“数据先行区”）启动活动在北京数据先行区管理服务中心成功举办。启动仪式上发布了《北京数据基础制度先行区创建方案》《北京数据基础制度先行区政策清单》。数据先行区的定位是，在全市特定区域，按照适应数据要素和数字经济特征的新型监管方式建立先行先试机制，加快建设数据基础制度综合改革试验田和数据要素集聚区。检察机关利用大数据赋能法律监督，通过数字检察大模型，为北京数据基础制度先行区提供数据合规智能化支持，为北京数据基础制度先行区营造良好的数字法治营商环境。

数字模型建设提供法治保障

8月17日，最高人民检察院召开党组会，应勇检察长强调，要紧紧扭住党和国家中心任务、首要任务，充分发挥检察职能，运用法治力量服务经济社会发展大局，加强与相关部门的工作协同，合力推动民营企业进行以合规建设为主的内控监督机制建设，促进民营企业守法合规经营。

近年来，北京市出台了一系列法规政策，为发展数字经济指明方向并提供制度保障，在数据资产登记、评估、入表、交易、融资和司法保障方面进行了大胆探索和创新突破，北京数据要素市场生态已经形成完整链条。

随着北京数据基础制度先行区启动运行，北京市将与时俱进地调整与数字生产力发展相适应的生产关系，持续构建适应数据特征、符合数字经济发展规律、保障国家数据安全、彰显创新引领的数据基础制度，探索建设有利于数据安全保护、有效利用、合规流通的产权制度和市场体系，培育发展壮大数据要素市场，推动北京数字经济高质量发展，在打造全球数字经济标杆城市各方面，迈出坚实步伐。而数据安全成为重中之重，数据合规也作为数据先行区的法治保障，地位更加凸显，数字法治营商环境的建设越加重要。

目前，数据合规案件线索存量不足，案件类型不够丰富，具有代表性、影响力的案件偏少。合规改革合力有待增强，“行刑衔接”机制落实难度较大。第三方机制管委会、专业人才库建设难以满足办案工作需要，特别是异地检察协作需不断加强，涉及数据安全的合规案件逐渐增加。但现行的第三方机制管委会成员单位尚未包括其中及专业人员库中缺乏该领域专业人员，对第三方机制启动运行带来瓶颈和困难。专业人员参与监督评估工作存在随意性，评估验收结论缺乏科学性。

因此，急需用数字模型对北京数据基础制度先行区企业合规管理体系创建活动的全流程跟踪管理，促进数据企业依法经营、规范治理、防控风险，贯通数据企业发展的各个阶段，做到“时时合规、事事合规”。

大模型为企业体检

合规大模型聚焦数据合规专项领域，经过内置研判规则，帮助数据企业建立前置性的数据合规风险预警机制。

该大模型旨在成为企业的体检中心和治疗中心。让北京先行区的数据要素“动起来”，首先是要数据合规。体检中心为企业提供定期“体检”和套餐“体检”，提前预知和更快识别自身问题，制定合规管理计划。治疗中心针对具体“病情”，靶向治疗，监督“治疗”进度，持续跟进，防止“旧病复发”“新病加重”。将企业提交材料和第三方监督材料进行整合与安全存储，通过数据分析模型生成企业合规性评估。

相较于传统监督手段，由企业法务或企业内控部门人工应对如此复杂的犯罪情况分析和企业内部管理，该合规大模型抓住了数据合规，金融数据、人工智能训练数据、数据交易都应以数据合规为“底座”，金融犯罪、跨境数据流动、数据交易犯罪也都通过数据分析评估和预防数据合规风险，并通过合规模型为第三方组织提供评估依据。

首先，需要做到将监督研判规则数字化、分值化，监督内容原子化、夸克化，AI将自主学习，自适应调整、比对，并自动应答。其次，加强数据企业内控、数据流动监管、重点人员管理、对外合作监管、金融科技监管、个人信息合规审计，利用数据合规模型实现内控。最后，北京急需数字检察大模型赋能数据跨境合规流动，而不是纸面合规、事后合规。

通过模型不断学习，帮助企业应对外部环境变化给企业带来的合规风险，如法律法规规章、监管政策的变化，国际政治格局、国际经济形势的变化等。

通过模型应用，帮助企业应对内部经营状况给企业带来的合规风险，如企业的商业模式、企业的业务领域变化、企业的合作伙伴等的影响。帮助企业增强风险合规意识，在监管部门的合规指引或合规指南下，建立包括商业行为准则、合规组织体系、合规程序、员工手册在内的合规计划管理体系，实现对企业战略决策、生产经营、人事财务管理等各个环节的全覆盖。

数据分析旨在利用企业提交的材料和第三方监督材料对企业进行合规性评估。通过对提交的材料进行信息提取，并进一步通过智能化的方式对信息进行精炼与分析，基于神经网络的自我学习能力，可以使模型的评估准确率不断提升，最终得到对企业的数据合规评估结果。

而相较于传统监督手段，构建跨境电商合规模型，通过运用大数据、生成式人工智能等对企业交易行为进行监督，实现数据合规业务需求全要素、实时分析和自适应迭代，解决人工审核中出现的有效合规与不起诉决定关系不明确问题、第三方监督评估工作费人费力问题等，显著提高了跨境电商企业合规的效率。通过模型预防民营企业内部人员侵害企业合法权益，并可直观且便利地了解数据企业合规风险。

本模型目前已在某大型企业投入运行使用，结合“一码通”进行数据采集，已为该企业合同审计部门、法务部门、内控管理部门及领导层提供数据统计及报表。已对212份合同进行了审计，发现高风险536个、总风险1492个，有效防范了民营企业内部人员实施的侵害企业合法权益与企业刑事案件的产生。为第三方组织对涉案企业进行合规考察以及检法调查核实提供企业内控评估机制与评估依据。

按照最高检《数字检察建设规划纲要》，数据获取将进行本地计算。通过联邦学习的方式，可以多个参与方在不共享原始数据的情况下进行模型训练，从而保护数据隐私和安全性。由于数据不需要离开本地设备，因此可以避免在传统集中式训练中可能出现的数据泄露和数据被盗用风险。

满足跨境数据贸易合规需求

近年来，随着数字经济发展，数据出境需求快速增长。北京在数据要素应用探索上先行先试，成立了国内首家数字经济标准化技术委员会、首个数据资产登记中心，上线了全国首个工业数据流通专区，为推动数据要素开发利用做出了有益探索。数据流通交易体系是持续释放数据要素价值的动力源。北京国际大数据交易所落地北京社会数据资产登记中心，与下一代互联网、北京国际数字经济治理研究院落地数据跨境服务中心，致力于成为国内领先数据交易基础设施和国际重要的数据跨境流通枢纽。

目前，跨境数据贸易领域属于较新的领域，没有系统性解决企业有效跨境数据合规的问题。跨境数据贸易领域也已经出现很多不合规的情况，与“一带一路”共建国家之间的数据贸易往来的规则不清晰，企业面临信息不对称、缺乏平台支持、跨境数据流动等问题，急需一套合规解决方案去满足跨境数据贸易企业的数据合规性需求。

将上述模型应用到北京数据基础制度跨境数据合规方面，可得到以下优势：

自我学习能力评估准确率不断提升：大数据分析的数据模型可以通过源源不断的数据输入和输出自我矫正模型，使得项目从长期发展的角度来看，精度和准确不断提升，结合专业的大数据分析技术团队可以有效提高数据模型的学习效率。

数据处理效率高：大数据智能分析的初衷是提高数据处理效率，以前的数据分析不仅费时费力，在数据分析结果上也不够准确，而智能分析大大节省了数据计算时间。

安全稳固信息安全保障：由于数据中心保存着众多个人信息，所以经常会受到各种网络威胁。而大数据智能分析通过对来自多个系统事件的分析，设计出合适的事件响应处理机制，再次遇到外界攻击时系统会自动启动防御机制，保障跨境电商数据中心的数据安全。

每年可根据北京数据基础制度跨境数据贸易企业合规评估结果，开展“3A信用企业”评选和联合激励，对于获得“3A”信用认证的企业，税务部门将提供包括“现场办税免预约”“出口退（免）税专岗直联”等个性化税收服务，并将信用等级评定纳入每季度的专项工作中，推动跨境数据贸易企业诚信经营。

（作者单位系辽宁省辽阳市人民检察院、北京市人民检察院）

（责编惠宁宁）

编辑：刘晓莹