[新闻] 释放数据价值 赋能千行百业——2025中国国际大数据产业博览会部分嘉宾专访录| 数博会官网

释放数据价值 赋能千行百业——2025中国国际大数据产业博览会部分嘉宾专访录

作者: 贵阳日报    编辑: 蔺弦弦  时间:2025-08-29 13:16:19  

  8月28日,2025中国国际大数据产业博览会在贵州贵阳开幕。会议期间,参加本次盛会的部分嘉宾接受了贵阳日报融媒体记者的专访。

  嘉宾们围绕本届数博会的主题“数聚产业动能 智启发展新篇”,就数字经济创新发展、推动数据资源开发利用、助力政企数智化转型、数据安全与保障等方面,结合各自专业领域畅所欲言,提出许多观点和建议。

  中国人民大学统计学院院长李扬:

  大数据时代要培养解决问题能力

  “业内有观点认为,人工智能是统计与计算机的深度融合。我也相信,随着人工智能的蓬勃发展,统计学的内涵与价值有了新的定义,统计学的发展也面临新的机遇和挑战。”李扬说。

  “大数据、人工智能给我们提供了很多工具、技术和路径,帮助刻画那些原本复杂的非线性现实世界。这些新方式能够让它模型化、可计算化,同时赋能各种垂类大模型与智能体,让它们具备‘人工模拟的智能’。这其中统计学发挥着非常重要的底层作用。”李扬说,研究者既可以用统计思维来支持人工智能的发展,也可以用人工智能工具来赋能统计学的教学与科研,助推彼此蓬勃发展。

  在人工智能时代,高校统计学人才的培养理念、培养内容和培养模式也在不断革新。李扬认为,在培养理念方面,要找准定位,坚持夯实理论基础,并提升学生面对真实场景的数据处理与分析能力。同时,要处理好统计思维和人工智能现实需求之间的关系,以及课堂学习和课外实践之间的关系。在培养内容方面,一方面要重视经典的统计模型与技术,打牢基础;另一方面,视角要随时代发展更新,将前沿的方法和理念融入基础性课堂,引导学生将知识转化为数据治理的能力。

  “大学校园里,既要关注拔尖学生,更要关注多数学生能力的培养,如何兼顾一部分学生‘吃不饱’、另一部分学生‘消化好’的挑战,需要教育工作者不断探索。一方面,优化课堂教学,保障基础知识与技能的培养。另一方面,在课堂外构建全面的训练体系,打造融合‘课程训练、研学训练、会议训练、竞赛训练、实践训练’的‘五训’培养体系,让所有学生基础学习有保障,并且能够个性化地提升能力。”李扬介绍,中国人民大学统计学院下学期将开设一门“AI赋能统计思维”的通识公共课,除了讲授数据思维等基础内容外,还专门邀请老师分享运用人工智能与数据科学帮助各行业解决实际问题的案例,让学生结合真实场景去思考,使用真实数据去探索,培养他们解决实际问题的能力。

  “人工智能为研究者检索文献、撰写代码等提供了便利,这当然是好事。但是在这个基础上如何发挥人的作用,如何培养学生的创新思维与解决实际问题的能力,是我们要重点关注的方向。未来,也许一些岗位会被人工智能替代,但我相信人工智能不会完全取代人。我希望学生将来走向社会之际,能具备驾驭人工智能工具的能力,掌握利用这些工具去探索并解决实际问题的能力。”李扬说。

  贵阳日报融媒体记者 刘健

  北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏:

  构建横向联通、纵向贯通、协调有力的全国数据基础设施

  在2024数博会上,张向宏发布了全国首份《数据产业图谱》,时隔一年,全国的数据产业又取得了哪些新的进展和亮点?张向宏说,主要包括数据企业迅速增长、数据规模快速扩大、数据产业集聚区初见雏形。

  张向宏介绍,去年发布的《国家数据基础设施建设指引》,提出了数场、可信数据空间、数联网、隐私保护计算、区块链和数据元件等6条技术路线,并在全国18个地方进行试点试验,在25个地方进行互联互通。当前,全国18个地方试点建设初见成效,今年第二批42个地方试点也将马上启动,无论是从数据的可信流通环境,还是在跨区域、跨行业、跨主体的互联互通,以及在培育数据的供需主体、应用主体和数据中介的服务处理主体等方面都取得了非常大的进展。

  “现在90%以上数据涉隐涉密,是不能在互联网上直接流通的。让以前不能流通的数据,或者以前流通效率比较低的数据既能大规模流通,又能保证流通中的安全,这是国家数据基础设施建设必须要做的。”张向宏说,通过试点示范、技术融合收敛、应用推广三步实施建设,2028年底会构建一个横向联通、纵向贯通、协调有力的全国数据基础设施,形成全国一张网。

  张向宏表示,近年来,人工智能和数据资源开发在探索数据要素化、价值化过程中取得了巨大成就。尤其是今年DeepSeek出现后,人工智能在千行百业具体落地的场景越来越多,这样的突破来源于人工智能三要素,即算力、算法和数据。DeepSeek实现了算力平权和算法平权,就面临着第三个障碍——数据。从今年开始,高质量数据集成了全社会关注焦点,并且也得到了国家有关部门的重视和推动,人工智能高端数据集中心现在星罗棋布,不过大多属于作坊化生产阶段,高质量数据集厂商规模不大、水平不高。另外,公开数据、加工数据方面也有改进的空间。

  张向宏还认为,要有花钱购买数据的意识,他以深圳发放语料券举例,希望国家推动相关补贴政策出台。他表示,既要支持数据的供给,也要支持数据运用和交易,让数据供出、流通和应用一条龙形成好的生态,让数据可以通过各种方式体现其应有的价值。

  贵阳日报融媒体记者 舒锐

  安恒信息首席技术官刘博:

  AI时代下数据安全不容忽视

  如何应对AI时代的数据安全挑战?刘博认为,首先,在大模型训练过程中,尽量不要让其接触敏感信息,可以通过智能化手段、智能化分类分级,在智能语料里保证数据的可靠性。其次,在构建AI应用时,当下大模型应用可能背后有几十个服务机构,要保证数据在通信等过程中不会因为意外或者是恶意情况下被泄露,安恒信息有专门MAF大模型应用防火墙保证其安全。MAF能够避免在使用大模型服务过程中的恶意请求,保证自身的行为安全。最后,在大模型上线前要做全面体检,并且及时修复,上线后要保证大模型运行中实时安全。

  此前刘博曾提出“数据安全需与企业信息化同等高度”“数据要素市场建设必须安全先行”等观点,刘博表示,一方面数据是政企单位重要资产,一旦发生数据泄露,对知识产权、重要软件资产、重要客户数据等会造成巨大影响和损失。另一方面,从国家层面讲,产生数据泄露,根据《中华人民共和国数据安全法》要负相关法律责任,做到数据安全也是政企单位应该履行的责任和义务。如果涉及个人隐私数据或者国家重要数据,会产生严重后果,所以和之前网络安全相比,数据安全要跟信息化或者智能化同步进行。

  随着大模型普及、数据流通激增和垂域智能化加深,安全防护边界已延伸至AI全生命周期,数据安全的内涵也拓展为“安全和增值”,该如何理解“AI全生命周期”与“安全和增值”概念?刘博解释,AI大模型就是现在最重要的应用之一,大模型利用了新一代的人工智能算法、架构,并且有大量高质量的数据,能够把几亿人积累了几十年的知识经验浓缩到一个大模型里,所以大模型包含了大量敏感和关键的数据或者是信息,所以在构建大模型应用时,数据安全问题就会发生。从技术层面讲,在训练大模型中会录入敏感信息,从而产生数据安全问题。另外,把垂域知识弥补到通用大模型里,也会产生很多数据泄露的风险。

  “大模型看似一个很简单的用户互动,但其背后涉及的数据交互、系统交互却涉及方方面面,作为一个数据驱动型产品,需要对数据安全高度关注。”刘博说,另外,大模型带来的虚假信息,特别是在教育、医疗、法律、意识形态等领域,一些信息看起来很合理但其并不真实,这也会产生巨大风险。

  贵阳日报融媒体记者 舒锐

  中国联合健康医疗大数据有限责任公司执行董事、总经理陈曦:

  期待与贵阳开展更多合作探索

  “今年4月,中国联合健康医疗大数据有限责任公司与国家药监局信息中心共同发布了国家级药品行业可信数据空间,该空间贯通行业监管数据与企业数据,实现药品全生命周期的数据共享应用。”陈曦说。

  陈曦介绍,从2023年开始,公司建设了药品追溯平台,打通了生产、流通、使用的所有环节,在此基础上,在药监局的指导下,共同推出国家级药品行业可信数据空间。“药品安全广受大家关注,是关系民生的重要行业。我们希望通过空间的建设,首先推动建立共管、共治模式,通过联盟形式对空间进行治理;其次,希望子空间先行,在药品领域挑选较为成熟的医药品先做探索;再次,通过开展白名单制进行试点推进。”陈曦说,目前,公司药品追溯已经实现重要品种覆盖,空间运营公司也与行业相关主体开展了相应的探索研究,正积极落地推进中。

  AI大模型正重塑医疗健康行业,在医疗诊断、健康管理、药物研发等场景中,AI最可能突破的方向是什么?中国联合数据在“AI+医疗”领域有哪些布局?陈曦表示,首先在创新药的开发上会有所突破;在健康管理上可以通过打通所有数据,给每人提供健康管家,让AI发挥巨大的作用;最后在医疗诊断上,可以把相关健康数据打通,通过AI提前预警,避免误诊问题。

  陈曦表示,自己十分关注数博会在政策引领、标准制定、生态协同等方面的信息,未来希望与贵阳在行业数据空间跟城市数据空间打通上有更多探索。当前,公司正在推“一人一码”个人健康账户体系,希望与贵阳试点推进,在前期基础上加强合作,通过课题研究、举办研讨会等形式,一起探索、推动相关产业发展。

  贵阳日报融媒体记者 舒锐

  彩讯科技股份有限公司董事、高级副总裁杨安培:

  让AI技术融入企业日常运营

  杨安培曾在去年12月12日举行的粤港澳大湾区新经济发展论坛暨21世纪科技年会上发表观点,他认为,AI在未来3至5年将重塑一切,对客户的服务方式甚至客户需求结构都将改变。针对这些变化,核心是要找准自身的生态定位,找到“天花板”较高的场景,尽快让行业模型、企业模型和应用、数据形成数据飞轮的良性循环。

  时隔大半年,杨安培表示,整体来看,当前AI的发展态势符合此前的预期。首先,大模型的发展为2B领域的用户减轻了不少负担。其次,经过这段时间的认知积累,大家对于大模型的认识不断加深,在最近半年,大模型在各类2B场景中的应用层出不穷,众多企业和从业者围绕这些场景展开了大量探索,并且取得了显著进步。

  杨安培说,彩讯科技自2004年创立以来,一直专注于企业数字化转型。随着生成式AI的爆发,公司基于多年积累的丰富业务应用场景,结合全面AI战略,对三大业务线进行AI升级,打造了从智算基础设施底座、一站式AI应用开发平台到AI应用及行业解决方案的全栈AI服务体系,面向企业及个人用户推出了数字人、数字员工、AI邮箱、企业知识库、语音智能体、图生音乐彩灵等产品,让AI技术融入企业日常运营及个人生活之中。

  对于企业基于AI开展数字化转型,杨安培建议企业应重视以下方面:第一,企业要清晰知晓所运用的AI模型的能力范围和局限性,避免因对模型能力认知不清而导致应用偏差;第二,企业需要定制AI转型的顶层规划,该规划需明确应用场景,规划数字治理与服务治理工作;第三,企业需认知AI应用的运营属性,在2B场景的AI应用中,需明确AI应用并非建成后就一劳永逸,而是需要通过运营不断完善;最后,企业应算好账,AI模型在使用过程中会产生一定成本,无论是基于公有云还是私有部署,都需确保AI应用的投入与产出相匹配,避免盲目投入导致资源浪费。

  “AI的应用是运营出来的,大模型在2B场景里的应用,我称之为是将‘不确定的事’与‘确定之事’的结合。”杨安培说,因为大模型存在不可控、不可解释的“幻觉”问题,而2B场景对结果的严谨性和可控性要求较高,要平衡这两者之间的关系,不能仅依靠前期建设,更需要通过持续的数据迭代和运营来优化,逐步解决应用中的问题。

  贵阳日报融媒体记者 董容语

  北京万联易达控股集团有限公司副总裁杜新凯:

  全力推动全产业大模型建设

  “我们打造的全产业大模型,目标是分批次、分节奏逐步覆盖国民经济的97个行业,推进建设。基于内部生态系统产生的交易、物流、金融服务的数据,我们积累了大量的可信数据,这些数据是产业互联网大模型建设的支点。”杜新凯说,基于多维度可信数据建立的大模型,可以为企业提供产业知识问答、产业数据问答、企业深度洞察、价格趋势预测、行业研报创作等功能,帮助企业提高效率,降低成本,助力企业数字化转型。

  杜新凯说,相比通用大模型,万联易达的全产业大模型的优势在于专业性和针对性,专注于对全产业各行业的深度挖掘与优化。通用大模型为产业大模型研发提供了技术基础,但产业问题更复杂、需求更精准,其中最大的挑战在于构建全产业可信数据,以及让大模型真正、准确理解产业与行业,实现与产业的深度契合。

  “数博会以推动产业数字化转型为重要方向,这与万联易达的发展使命契合。”杜新凯说,“我们公司的使命其实就是构建新型产业互联网生态系统,帮助生态伙伴打造可信数据空间。无论是产业互联网的生态系统还是可信数据空间,其实都是为了推动产业的数字化转型。”

  杜新凯说,在全球化发展与数字经济创新的背景下,万联易达也在积极规划国际合作与全球平台搭建。企业产业互联网生态系统的核心是四大基础平台——人工智能应用平台、商品交易平台、物流服务平台、数字金融平台,这四大平台构成了生态系统的核心基础能力,能够吸引各类产业平台、产业链企业、中小微企业、服务机构加入。

  “这一生态构建逻辑不仅适用于中国,在全球数字经济创新中同样具有适配性。”杜新凯表示,未来,一方面要加强国际交流与合作,吸引全球优质资源加入生态;另一方面,主动贡献技术与经验,助力全球数字经济创新生态的建设与发展,推动全球产业数字化转型迈向新高度。

  贵阳日报融媒体记者 董容语

  中国欧盟商会碳市场工作组主席靳博阳:

  大数据技术可提升碳排放管理水平

  “碳市场的发展最核心就是监测、报告与核证这三个环节,可以说三者缺一不可,而且它给碳市场的运行提供了核心的数据基础,关系到每个控排企业到底排放了多少二氧化碳,有没有超出排放配额,能不能通过出售配额盈余在碳市场中获利,这都是非常重要的。”靳博阳说。

  数字化和绿色化协同转型是当前发展的趋势,企业应该如何利用数据要素和数字技术来优化能源管理、打造绿色供应链?靳博阳认为,企业首先要对自己进行碳排查摸底,编制企业碳账本。当企业把碳排放和产品碳足迹进行全方位且细致准确的计量后,就能够帮助企业从容适应各种碳相关政策,根据实际情况结合自身碳账本进行技术改造或新建项目,达到切实降低自身碳排放的目的,这是数据资产发挥最大效用的地方。

  靳博阳表示,数字化和绿色化是两个长期并行不悖的趋势,数字化可以作为“双化协同”的基座,因为很多政策都必须基于可信的、有参考价值的数据。例如,地方政府可以根据公用事业类企业的数据网,以数字化为底座,根据地方实际,像搭积木一样构建地区能源绿色转型政策规划,更加科学合理;反过来,数据产业本身也是一个用能大户,很多企业的数据中心用电量都非常大,它们也面临绿色转型的压力,也需要购入绿电或绿证来降低自身碳排放。在政策的引导下,公用事业类企业能够帮助数据行业企业,利用大数据、AI模型等技术降低数据行业碳排放,这将是一件两全其美的事情。

  “基于区块链技术的去中心化以及不可篡改的特性,对于企业报告自身碳排放数据的准确性能够起到一个非常强的加持作用。目前,欧盟与英国等经济体在推行碳边境税的过程中,由于尚未完全认可我国碳排放数据的准确性,导致其数据库中针对中国企业的碳排放强度缺省值普遍畸高,这将给企业造成沉重的碳税负担。通过这些新技术,不仅能让企业获得国家乃至世界都更为认可的、准确性更高的碳排放数据,还能间接提升企业的碳管理及环境、社会和公司治理水平,为企业降低碳税和融资成本,这是尤为重要的。”靳博阳说。

  贵阳日报融媒体记者 刘健

  美国摩根路易斯律师事务所合伙人廖圣强:

  中国在数据安全、数据隐私方面的法律已成体系

  “目前,中国在数据安全、数据隐私保护的法律已成体系,形成了以《中华人民共和国个人信息保护法》《中华人民共和国网络安全法》《中华人民共和国数据安全法》为核心的架构,不仅在数据保护方面体现了合规底线,而且有着跨部门协调的监管思路,为各行各业的发展保驾护航。”廖圣强说。

  “在经济全球化加速发展的当下,对于企业来说,出海是一个趋势。”廖圣强说,在日常的执业过程当中,发现中国企业出海的目的地国数据合规变成了一种非贸易壁垒。因此,建议企业不仅要了解中国本土的数据安全、数据隐私方面的法律规定,也要及时地去跟踪一些重点法律法规和执法实践的发展。

  廖圣强说,在数据产业迅猛发展的背景下,随着数据交易活跃度提升,“交易合规”成为核心前提,企业需通过尽职调查确保数据来源合法,严格禁止非法数据买卖,且收集处理数据必须遵循“数据主体知情同意”原则。同时,AI技术的快速发展催生了新的法律挑战。数据用于大数据推理、大语言模型训练后,新生成内容的版权问题、合规问题日益复杂,全球范围内相关法律诉讼已逐步增多,成为行业关注的热点。未来,随着底层商业交易模式的创新,数据法律需求将持续迭代,围绕数据权属界定、AI生成内容合规、跨境监管协同等领域的新需求将不断涌现。

  廖圣强说,数据版权的问题是目前比较热点的问题,全球许多地方都出现了相关法律诉讼,也是非常值得关注的一个发展趋势。应对中外法律法规的差异,建议企业重视数据梳理。数据梳理的核心是根据企业的业务模式,系统地分析信息种类与数据,以便应对在跨境传输中可能面临在不同法域的合规风险,并有针对性地制定合规方案。

  廖圣强说,在跨境数据监管方面,中国采取了兼具发展的灵活策略。在国际上来说,尤其是现在个别国家基于地缘政治等各方面的考虑,出现了监管越来越严的趋势。“千万不能认为在中国符合了中国法律的规定以后,出海到其他的国家应该也是安全的,绝对要根据当地的法律、结合自身业务模式的数据梳理来有针对性地去评估风险,并建立一个非常有针对性的合规方案。”廖圣强说。

  对于数博会在促进数据产业法律交流方面的优化方向,廖圣强提出期待:“希望数博会除推动数据交易、商业合作外,进一步加强跨境数据隐私保护与合规法律专家库建设,为中国企业在跨境数据交易、流动过程中提供专业法律资源支持,更好发挥平台的桥梁作用,助力企业规避风险,推动数据产业全球化健康发展。”