打破专用模型的“跷跷板效应”,LDM有望实现“一个模型赋能千行百业”
◎记者 杨升 刘立
近日,由清华大学计算机系长聘副教授崔鹏团队联合稳准智能科技有限公司(简称“稳准智能”)联合研发的“极数”数据大模型(LimiX)在雄安新区发布最新成果与战略规划。作为国内首个结构化数据通用大模型(LDM),这也是LimiX首次公开亮相。
崔鹏对上海证券报记者表示,自2025年8月29日开源以来,LimiX已经在20余个行业的多个场景进行了落地应用验证,未来有望成为“人工智能+”战略的数字底座之一。
在当天的发布活动上,中国科学院院士、清华大学人工智能研究院名誉院长张钹认为,LDM的兴起,标志着AI范式的重要转变。其技术本质是构建能够理解数据内在因果机制的“通用世界模型”,从而真正实现“一个模型赋能千行百业”。
多位受访专业人士均认为,LDM是激活我国海量工业数据资源、赋能实体经济的“国之重器”。我国已在因果推理、合成数据与通用架构上构筑起独特优势,正处于从技术突破到产业爆发的临界点。LimiX的成功,正在实现从语言大模型(LLM)并跑到数据大模型(LDM)领跑的跨越。
LDM为何能改变工业AI游戏规则?
“如果说LLM像一个‘文科大脑’,擅长处理语言理解、文本生成等任务的话,那么LDM就是一个‘理科大脑’,专注于从结构化数据中分析规律、归纳总结并进行预测决策。”崔鹏这样描述两种大模型的区别。
据崔鹏介绍,LDM可弥补LLM的短板。虽然LLM具有较强的文本理解与生成能力,但因其训练数据中缺乏结构化数据,导致其在处理结构化数据时束手无策。LDM则能够处理表格数据、时序数据、图状数据等结构化数据,胜任数据分类、预测、归因等复杂任务,能够充分发挥数据要素聚集的乘数效应,实现跨场景、跨任务、跨数据形态的通用预测和决策。
在泛工业领域,工业生产参数、设备运行数据、质量检测数据、科研实验数据等均以结构化数据形式呈现,其智能处理能力直接影响产业效率与科研突破。记者了解到,LDM可广泛应用于工业、通信、能源、科研等场景。崔鹏说:“我们团队所研究的模型并非针对特定任务,而是在某种意义上作为工业的智能基座,与相关行业发生‘化学反应’,实现1+1>2的效果。”
据了解,目前,崔鹏团队研发的LimiX模型已在部分指标上领先于美国、德国、法国等国家的同类型模型,属于之一梯队。虽然德国Prior Labs在学术成果上捷足先登,于2025年上半年发表《Nature》,但文章只包含基本的理念与想法;美国Amazon于2025年11月发布模型,但性能与之一梯队仍有较大差距。
中网联合(北京)能源服务有限公司是一家电力交易企业,公司董事长蔡静鹏称,在高比例新能源接入的背景下,传统电网信息不互通、调度不灵活的局限性愈发明显。LDM能够实现毫秒级的功率平衡运算,促进电力供给和用户需求精准对接。此外,LDM还能应对极端天气、节假日出行高峰、企业集中复产等情况下突发的用电负荷预警,可以提前预判几点钟、有多少人用电,让电力负荷调配不再像“开盲盒”。
彩讯股份是一家企业级数字化与智能化服务商。公司CEO白琳对记者表示,运营商数据量非常大,数据结构也很复杂,过去依赖小模型,每个场景都要重新训练,资源消耗非常大,当下行业发展日新月异、节奏持续加快,过往小模型的运作模式已难以适配高效需求,凸显出明显的效率短板。
“如今,通信运营商领域相关企业希望对结构化数据进行有效利用,一套通用模型适配用户流失量预警、用户流量增长趋势预测、换机营销预测等,指导相关企业经营决策与资源分配。”白琳说,“公司的Rich AIbox多模态数据整合能力与LimiX相结合,联合行业合作伙伴共同打造可复制的解决方案,可实现从过去经验判断到数据驱动的升级。”
在LDM赋能高性能金属材料方面,钢研国际新材料创新中心(深圳)有限公司总经理毕中南对记者表示,借助LDM,不仅能发现不同元素含量与材料性能的规律,还能挖掘其优化机理,快速锁定设计参数及成分配方,非常适合新材料这种数据稀缺且昂贵的垂直行业。
崔鹏说:“结构化数据通用大模型不仅可以解决工业场景里的问题,还能突破AI for Science的部分痛点问题,将为科研带来难得的机遇。”
一个模型为何能赋能千行百业?
LimiX的开源发布与传统AI在工业领域的应用有什么区别?
崔鹏表示,LDM是人工智能从感知走向决策、赋能新型工业化的核心引擎。LimiX的开源发布,其重要意义在于终结了传统AI在工业领域“一个场景、一套数据、一个模型”的低效范式。
——打破专用模型的“跷跷板效应”。崔鹏称,工业领域的传统AI应用存在“跷跷板效应”:若想解决更多的任务,就要牺牲特定任务的精准性;若想精准性高,就要放弃一部分通用性。LDM或将打破这种“跷跷板效应”,实现通用性与精准性的双提升,既能保证跨场景、跨任务、跨数据形态的通用性,又能保证预测性能超过90%场景中的专用模型,无需参数微调或超参数优化。
——提高决策信心和透明度。蔡静鹏对记者表示,LDM不仅提供了一个重要的结果支撑,还打开了“黑匣”,其产生的每一个结果都具备较强的可解释性,可以提高决策的信心与透明度,让专业人员在决策的过程中更信任人工智能与数据结果。
中冶京诚数字科技(北京)有限公司总经理田淑杭称,以电机轴承故障为例,传统的故障诊断仅对明确的采集参数进行报警,比如震动大,温度高。而LimiX可预测振动频谱中赫兹分量异常升高、润滑油油温上升的趋势,在未达到故障标准时就提前预警,防患于未然,大大降低设备设施的运维成本。同时,LimiX还可以从数据的角度,找到影响设施故障的未知因素。
——大幅降低开发和使用成本。毕中南说,目前工业结构化数据处理依然依赖私有数据+专用模型的传统范式,需要针对不同的场景进行一对一开发和适配,成本较高。崔鹏表示:“根据现有测算,LDM概念验证的经济成本仅为工业领域传统‘私有数据+专用模型’模式的10%。”田淑杭认为,传统模型在部署上对资源要求较多,而LimiX为轻量化模型,可以部署于冶金等产线及相关边缘设备,可以实现毫秒级的本地实时推理和预警。
首个LDM为何落地雄安?
国内首个LDM为何在雄安诞生?走进雄安科创中心、中关村科技园等平台载体,创新气息扑面而来。这里构建了分级分类的培育体系,为企业提供从空间选址、融资对接到创业辅导的全链条服务,一批高成长型科技企业在此破茧成蝶。
据记者了解,“十四五”以来,雄安新区不断完善人工智能创新生态,助力本地AI创新平台建设、人才培育与资源集聚。
稳准智能相关负责人告诉记者,2025年6月,雄安人工智能产业园开园、雄安新区与清华大学联合AI研究院揭牌后,清华相关团队创办的稳准智能入驻园区。园区给予企业近乎零租金的房租补贴,使其能将更多资金用于研发;还协助企业在2025年9月顺利完成Pre-A轮融资,为其发展筑牢资金基础。
“LimiX开源以来,我们已在能源、钢铁、化工、通信等行业实现在新区的落地验证。目前,公司正在和中国雄安集团智慧能源公司进行合作对接,有望根据天气情况、居民人数等预测用气量,帮助该公司精准预测接下来一段时间内需要购买的燃气量。”上述负责人表示。
谈及LimiX在雄安的应用,张钹表示,包括清华大学在内的科研机构都有不少的技术积累,这些技术积累在地方进行产业落地,可以很好促进当地产业经济发展。雄安新区有很多好的政策,可以很好地让这些先进技术落地。
他还建议雄安新区打造LDM创新中心,推动标杆模型规模化示范,通过构建“数据大模型(LDM)+产业集群”的生态,为全国提供AI驱动新型工业化的“雄安方案”。下一步,应以应用示范为突破口,以生态建设为支撑,以政策协同为保障,全力推动LDM走进千行百业,将其锻造为赢得新一轮全球科技与产业竞争的战略支柱。