长江中下游地区城市水环境治理技术研究专栏

大模型与水文模型协同应用关键技术研究及展望

  • 林子源 ,
  • 赵强 ,
  • 张驰 ,
  • 吴彤 ,
  • 李翀
展开
  • 长江经济带生态环境国家工程研究中心, 武汉 430014
李 翀(1971-),男,广西桂林人,正高级工程师,博士,研究方向为水电环境保护及生态水文过程。E-mail:

林子源(1997-),男,宁夏中卫人,助理工程师,硕士,研究方向为大模型智能体开发。E-mail:

Copy editor: 任坤杰

收稿日期: 2024-09-30

  修回日期: 2025-03-18

  网络出版日期: 2025-10-17

基金资助

中国长江三峡集团有限公司科研项目(NBWL202300014)

Key Technologies and Prospects for Synergistic Application of Large Language Models and Hydrological Models

  • LIN Zi-yuan ,
  • ZHAO Qiang ,
  • ZHANG Chi ,
  • WU Tong ,
  • LI Chong
Expand
  • National Engineering Research Center of Eco-Environment in the Yangtze River Economic Belt, Wuhan 430014, China

Received date: 2024-09-30

  Revised date: 2025-03-18

  Online published: 2025-10-17

摘要

将大模型与水文模型结合,可提高水文模型的适应性与拓展性,降低模型使用门槛,加速水文科学的智能化进程。在搜集整理水文模型资料并分类阐述其特点的基础上,指出水文模型存在可移植性差、对数据质量敏感、极端事件预测能力弱等不足;明确其智慧化需融合知识辅助决策、优化交互方式以增强多模型协同解决复杂问题的需求;结合当前大模型的研究应用现状,指出水文模型与大模型具备优势互补特性。提出了大模型与水文模型单向耦合和双向耦合的协同方式;结合协同方式,基于自然下垫面与城市下垫面的湖泊入流复合水文过程,构建大模型与水文模型耦合的思路框架。这种耦合不仅以智能接口形式降低了专业水文模型的应用门槛,更通过动态参数优化与协同计算机制,提升了复杂水文过程模拟的效率和应急决策的精准性。

本文引用格式

林子源 , 赵强 , 张驰 , 吴彤 , 李翀 . 大模型与水文模型协同应用关键技术研究及展望[J]. 长江科学院院报, 2025 , 42(12) : 216 -226 . DOI: 10.11988/ckyyb.20250588

Abstract

[Objective] Traditional hydrological models are mostly designed for specific scenarios, representing simplifications of complex physical processes or fitting of historical data. They require extensive modeling and driving data, and have high technical threshold for use, which largely limits their widespread application. Large language models, with their powerful understanding and generative capabilities, demonstrate superiority in the framework design and interaction processes of complex systems. Integrating large language models with hydrological model systems can provide an intelligent engine for the data collection, model construction and calibration, and simulation result analysis required by hydrological models. This enhances the adaptability and extensibility of hydrological models and lowers the model usage threshold. Therefore, this study explores the synergistic application paths for large language models and hydrological models and provides a prospect for future research priorities in their synergy. It aims to provide support and technical reference for the synergistic development of the two models, reduce the usage threshold of hydrological models, and accelerate the intelligent transformation of hydrological science. [Methods] Starting from hydrological models, based on the collection and organization of current hydrological model information and the classified elaboration of their characteristics, this study identifies problems such as poor portability, sensitivity to data quality, and weak predictive capability for extreme events. Additionally, it clarifies three requirements for their intelligent transformation: integrating knowledge-assisted decision-making, optimizing interaction methods to lower the usage threshold, and enhancing multi-model synergy to address complex problems. Combining the current research and application status of large language models, this study reviews the technical trends of mainstream large language models and analyzes the challenges in their practical application, including a lack of domain-specific knowledge, weak business reasoning capability, and difficulties in collaborating with professional tools. Finally, the study points out that hydrological models and large language models have complementary advantages, making their coupling inevitable. An application example is provided, focusing on the composite hydrological process of lake inflow from natural and urban underlying surfaces. [Results] This study proposes synergistic approaches for unidirectional and bidirectional coupling between large language models and hydrological models. This enables the effective utilization of large language models across various application scenarios of hydrological models, provides support and technical reference for their synergistic development, and contributes to lowering the usage threshold of hydrological models and accelerating the intelligent transformation of hydrological science. Combining the synergistic approaches for unidirectional coupling and bidirectional coupling, and based on the composite hydrological process of lake inflow from natural and urban underlying surfaces, a conceptual framework for coupling large language models and hydrological models that is universal and innovative is constructed. Additionally, specific implementation procedures are provided, offering a reusable methodological reference for studying complex hydrological processes. [Conclusion] The coupling technology of large language models with hydrological models, through continuous exploration and research, has preliminarily demonstrated the application potential of integrating large language models with hydrological simulation and prediction. Large language models, leveraging their advantages in semantic parsing, dynamic parameter calibration, and multi-model synergistic scheduling, have expanded the functional boundaries of hydrological models in aspects such as real-time interactive response, cross-scale coupled simulation, and emergency decision-making support. This integration not only lowers the application threshold of professional hydrological models through intelligent interfaces, but also enhances the efficiency of simulating complex hydrological processes and the accuracy of emergency decision-making through dynamic parameter optimization and synergistic computing mechanisms. The coupling of these two models demonstrates rapid adaptability to novel environmental conditions and the characteristics of autonomous reasoning and optimization, paving an innovative path for establishing a “perception-simulation-decision” full-chain integrated digital twin watershed system.

0 引言

近年来,人工智能技术快速发展、大模型不断迭代突破,推动了人工智能技术步入从智能感知到智能认知、从传统模式到创新模式快速发展的新阶段,为经济社会高质量发展注入源源不断的新动力。因此,未来人工智能与各行业实际应用的深度融合与精准匹配,将成为驱动社会数字化转型与智能化跃升不可或缺的核心要素。
水文科学是地球科学的一个分支[1],它直接关系到我们对自然水循环的深入理解、水资源的有效管理与保护以及水灾害的科学预防与控制[2]。水文模型,作为探究水文过程的核心工具,通过精确模拟和预测水文系统的动态变化,为水资源规划[3]、洪水预警[4]、生态修复以及环境影响评估[5]等多个领域提供至关重要的技术支持和科学决策依据。然而,针对特定场景的传统水文模型是对复杂物理过程的简化或对历史数据的拟合,所需建模及驱动数据繁杂,应用技术门槛高,这在很大程度上限制了其推广应用。大模型凭借其强大的理解能力和生成能力,在复杂系统的框架设计与交互过程中展现出优越性。将水文模型与大模型相结合,能够为水文模型所需数据的收集整理、模型构建及率定、模拟结果分析提供智能引擎,提高水文模型的适应性与拓展性,降低模型使用门槛。
为此,本文从以下几个方面进行深入探讨:①系统梳理大模型技术应用走向和应用挑战,并分析水文模型新阶段的智慧化需求,明确大模型与水文模型协同的重要意义;②深入分析大模型与水文模型协同的关键技术,涉及协同方式和相关技术手段,为后续的落地应用提供技术基础;③结合湖泊水文过程模拟的实际场景,说明单向耦合和双向耦合的实现方式,以期为大模型与水文模型的协同发展提供技术参考,降低水文模型使用门槛,加速水文科学的智能化进程,为水资源管理、洪水预警、生态环境保护等领域提供技术支持。

1 大模型与水文模型协同应用背景

1.1 水文模型应用现状

1.1.1 水文模型分类与特点

依据建模思路与适用场景,水文模型可分为物理水文模型和系统水文模型两大类。
物理水文模型以水文循环的物理过程为基础,通过公式描述降水、蒸发、下渗等环节的机理。其特点在于机理明确,模型结构严格遵循物理定律,参数具有明确物理意义;能够详细拆分并模拟水文循环的各个子过程,通过耦合方程描述各过程的相互作用;但对数据要求高,需输入流域地形、土壤属性、植被类型等详细信息。如MIKE SHE模型是全分布式物理模型,用圣维南方程组、理查兹方程等描述地表、土壤等水文循环过程;SWAT模型则是半分布式模型,将流域划分为子流域和水文响应单元进行模拟。然而,物理水文模型存在输入参数过多且模型率定困难、数据需求和计算成本高、极端条件适应性差等局限[6-8]
系统水文模型将流域视为“黑箱”,不关注内部水文过程的物理机理,而通过统计方法或经验公式拟合输入观测数据与输出观测数据的关系。其特点是机理模糊,参数多依靠经验定夺;依赖大量历史观测数据,数据质量和数量影响模型精度;结构简单,计算高效,适用于短期预测。如单位线模型基于经验汇流,线性回归模型直接拟合降雨与径流关系,人工神经网络通过数据训练拟合复杂关系。但系统水文模型缺乏物理基础,可移植性差,对数据质量敏感,无法模拟过程细节,极端事件预测能力弱[9-11]

1.1.2 水文模型智慧化需求

水文模型为水文过程提供了重要的决策支持依据,但应用过程极为复杂。为此水文模型智慧化发展需求迫切,具体体现在以下几个方面:
一是融合知识辅助决策的需求。水文系统不仅涉及气象、水文和地质等自然科学因素,还与社会经济活动、政策制定和生态保护密切相关。这种多领域交互需要模型能够从结构化和非结构化数据中提取知识,并通过智能推理支持复杂场景下的决策制定。智慧化水文模型需要通过融合物理过程、人工智能算法和领域知识建模,以增强对动态变化过程的预测能力和对突发事件的响应能力,为场景应用提供更科学、更智能的支撑。
二是优化交互方式、降低使用门槛的需求。水文模型运行依赖于复杂的参数体系与精细的模型架构,这就要求使用者具备扎实的水文专业理论知识和丰富的实践操作经验。同时,水文模型的结果解读往往需要结合专家经验和规则要求,才能更好地把握水文过程的内在规律。智慧化水文模型可减轻对专家的过度依赖,简化实现应用流程。
三是增强多模型协同解决复杂问题的需求。复杂水文问题往往涉及多专业模型,而各专业模型主要解决单一场景的单一问题,各模型之间缺乏有效的整合和协同机制,导致模型之间信息无法共享,限制了模型价值的最大化。智慧化水文模型需要能够根据需求来选择合适的水文模型进行模拟,解决应用场景的复杂问题。

1.2 大模型应用现状

1.2.1 大模型技术应用走向

大模型技术的持续优化和升级、应用场景的不断丰富和细化,以及各行业智改数转需求的日益高涨,共同推动着大模型应用的快速发展,并逐步形成了多阶段的技术路径,如图1所示。
图1 大模型应用技术走向

Fig.1 Trend of application technology for large language models

在技术探索阶段,基座大模型得以快速发展,过程中出现了文心一言、通义千问、智谱、DeepSeek等系列基础大模型,这为后续场景应用起到关键性作用。这一阶段,以引导模型进行专业回复和场景知识库外挂形式进行结合,主要的实现技术包括:提示词工程、增强检索生成(Retrieval-Augmented Generation, RAG)。通过对提示词设计,引导大模型生成符合垂直领域需求的输出;借助RAG技术,扩充大模型在场景应用中的知识边界,两者的相互结合是大模型在场景应用初期直接、高效的技术实现。在技术研究和实践应用过程中,提示词工程出现了思维链、思维树、思维图等方式[12-14],帮助模型在处理场景复杂问题时逐步展开逻辑,提升其在逻辑推理和问题分解上的能力,但还是存在模型的幻觉问题。为了能够减轻模型幻觉,RAG技术通过切片、向量化等步骤,为模型的每次回复提供符合场景的上下文内容,增强其在垂直领域问答的专业性,切片-向量化检索的过程可能造成部分数据信息损失,出现召回率低、回答精度不理想的情况,有相关研究也通过知识图谱增强、模型检索重排等方式优化RAG技术在场景应用上的效果[15-16]
在行业适配阶段,大模型开始关注在场景应用中更好的落地实践,过程中考虑从模型层面和业务层面更进一步的结合。主要实现大模型微调技术、多模态模型接入以及开源工具使用。通过大模型微调技术,可以将行业数据高效地注入基础模型;通过接入多模态模型,可以丰富场景应用地交互形式;加上开源工具辅助,大模型在这一阶段的垂直应用得到了更好实现。高效微调通过LoRA、QLoRA[17-18]等技术,显著减少计算成本和存储需求,适合垂直场景应用中实现快速定制化训练,但需要前期对领域数据进行整理。多模态模型以跨模态理解与生成能力,实现对场景复杂信息的综合处理与分析,过程中出现了对比语言图像预训练(Contrastive Language-Image Pre-Training,CLIP)[19]模型架构,有效突破单一模态的表达局限,但需注重多源数据的对齐与协同优化[20-21]。为了高效合理地将大模型接入垂直应用,开源工具中的工作流程排版成为了有效的实现方式。Coze、Dify、n8n、Fastgpt、Bisheng等开源平台将众多场景应用功能模块化,使大模型低成本、高效率的融入业务场景中。
在智能融合阶段,大模型聚焦获取专业场景中的外部工具,过程中出现了函数调用、模型上下文协议(Model Context Protocol,MCP)等相关技术[22-23]。通过将垂直领域自有专业模型与常用工具开发成为可供大模型调用的外部工具,再结合函数调用、MCP实现调用,是大模型专业能力拓展的新思路。过程中发展出LangChain、Google-ADK、Qwen-Agent等大模型集成实践框架,有效拓展了大模型应用边界,也降低了大模型应用开发成本,但过程中需要提前设计合理的外部工具函数接口与调用逻辑。MCP提供了解决思路,以轻量化的数据传输机制实现多模型协同工作,提升了领域专业模型间的协作效率,满足复杂业务场景下的模型组合需求,但过程中需将涉及的专业工具开发成可调用模块, 这也要求大模型自身具有较好的任务分析和调用能力。

1.2.2 大模型技术应用挑战

大模型技术不断推进,各行业落地应用进入快速成长期。然而,大模型能否有效实践,关键问题在于能否理解专业场景知识、能否具备任务分析能力、以及能否调用场景已有的模型和工具。当前基础大模型是通用模型,在应用的过程中会存在分析与专业性局限。其原因主要有以下几个方面:
一是缺乏专业背景知识。大模型在专业领域知识的覆盖广度与深度层面存在局限性,这导致大模型在专业名词理解、现象解释以及物理机制解析等方面出现偏差或错误。因此,面对专业场景中的复杂问题,大模型难以精准把握核心要点,无法基于专业知识进行深度分析与推导,输出的内容缺乏专业性和可信度,无法满足专业场景对高精度知识输出的需求。
二是缺乏业务推理能力。通用大模型擅长文本理解与生成,却不具备专业场景下的逻辑推理与决策能力。这致使大模型在面对专业场景中的复杂问题时,无法进行准确的问题分解,难以梳理出问题的关键要素和内在逻辑关系。在制定解决方案时,无法根据实际业务情况进行合理规划与调整,无法提供符合业务需求和实际操作可行性策略,无法为专业场景中的业务活动提供实质性帮助,限制了大模型在专业场景中的应用价值。
三是缺乏与专业工具的协同。各行业已积累了针对特定任务的专业工具,但基础大模型无法直接调用这些专业工具。由于缺乏标准化的接口和适配机制,大模型难以将专业工具的输出结果与自身知识体系结合。这使得大模型在专业场景应用中,难以提供专业且准确的决策支持,无法满足专业场景对高精度分析和预测的需求,从而限制了大模型在专业领域的深度应用。

2 大模型与水文模型协同关键技术

大模型与水文模型协同实现了“数据驱动”与“物理机理”互补融合:结合领域知识图谱构建与动态规则库更新,大模型通过知识增强技术解决传统方法中专家经验难以量化的困境;此外,大模型通过外部工具获取,调用多尺度耦合的水文模型,解决复杂场景中动态耦合问题。水文模型则依托其过程模拟或数值预测能力,为大模型的逻辑推理提供数值验证与机制解释,规避模型幻觉和专业能力局限问题。因此,突显了大模型与水文模型协同的重要性,而两者的协同方式和技术手段又是其重点。

2.1 协同方式

借鉴已有模型间的耦合方式[24-25],结合当前大模型和水文模型各自的研究进展,按照耦合紧密程度,大模型与水文模型的耦合方式分为单向耦合与双向耦合。两种耦合方式针对大模型均可解决知识融合与优化交互的需求;在多模型调用上,单向耦合主要考虑已率定好的水文模型,而双向耦合则更偏向于因外部环境改变待率定的水文模型。单向耦合简单高效已被广泛应用,未来将研究双向耦合的应用推广。

2.1.1 单向耦合

单向耦合是指大模型和水文模型相对独立运行,通过明确的输入输出应用程序编程接口(Application Programming Interface,API)实现单向的信息传递。大模型用于数据预处理、结果分析或辅助决策支持,而水文模型专注于物理过程的模拟或对数据结果的预测。由于两者的开发和运行环境相对独立,单向耦合可采用接口封装策略实现大模型对水文模型选择性调用。在此过程中,水文模型需要进行工具注册、大模型工具发现、任务理解调用、结果分析输出。大模型与水文模型单向协同示意如图2所示。
图2 单向耦合方式

Fig.2 Unidirectional coupling method

在单向耦合模式下,因路径提前设定,模型协同过程更为准确。前序大模型A可以通过提示词工程、自我反馈等方法,引导大模型对复杂专业问题进行任务识别、分解,明确进一步接口调用目标和采取的对应行动。在水文模型方面,将多个场景已率定的水文模型的功能接口进行封装,明确各水文模型输入参数与输出数据,整理其与大模型协同的规则方案,以供大模型在任务规划后通过工具调用形式进行准确调用,达到协同效果,实现大模型在水文相关专业场景的专业化模拟应用。之后,大模型选择性调用相关水文模型,水文模型在经过内部模拟后会将输出内容给到后续的大模型B,大模型B需要对相关专业数据具有解析能力和理解能力,其中涉及大模型微调技术,以及代码解释器调用、数据库调用、智能报告生成等技术,以便大模型最终给出智能分析结果。
大模型与水文模型的单向耦合通过明确的接口实现信息流动,使两者能够各自独立运行并高效协同,这也是当前模型配合的主流方式。在实践中,需要根据场景任务进行系统搭建、模型调试及流程提示策略优化,以确保协同效果的精准实现。

2.1.2 双向耦合

双向耦合是指大模型和水文模型之间可以动态交互,信息实现双向流动。大模型不仅辅助水文模型的运行,还根据水文模型的输出反馈进行自适应调整。通过这种机制,大模型可以根据水文模型的中间输出实时进行环境状况获取、专家建议分析、模型率定数据读取等,水文模型也可以根据大模型率定策略更新等要求及时改进模型行为,两者动态协同从而提升模拟结果的精度和可靠性。相比单向耦合,双向耦合方式的耦合程度更高,需要一定的通信和接口开发,适用于需要动态决策和实时响应的场景。大模型与水文模型双向协同示意如图3所示。
图3 双向耦合方式

Fig.3 Bidirectional coupling method

在双向耦合模式下,大模型与水文模型的协同过程更加灵活。针对条件复杂多变的不稳定场景,模型之间的相互反馈能够更好地满足系统要求,提高协同模型的适应能力。通过“思考—动作—观察”模式来实现复杂任务的分解处理[26]。前序大模型A接收用户指令后,对用户复杂专业问题进行任务识别,明确进一步接口调用目标和采取的对应行动,外部环境改变导致水文模型需要再次率定的,可通过中间量与大模型实现双向互动。中间量的介入目的在于能够动态调整协同过程,使系统在复杂的应用场景中表现出更好的适用性。具体来讲,水文模型到大模型的中间量可以表现为模型模拟实时效果与用户中途指令补充,大模型到水文模型的中间量可以为不同的水文模型选择、边界条件更新、参数率定方案调整等,当中间量在协同过程中的变化达到一定阈值后,继续进行后续流程。
大模型与水文模型双向耦合通过中间量的自适应调解,使得大模型和水文模型应用过程更加动态和智能,对于模型之间的配合提出了更高的要求。在实践过程中,需要做好通信和接口的开发工作,以及中间量的设定和调优。同时,双向耦合模式对大模型的要求更高,需要进行相关水文模型调用的微调或者知识库搭建进行支撑。

2.2 技术手段

大模型与水文模型协同关键技术体现在任务规划、工具选择、工具调用与回答生成等处理阶段上[27]。大模型外部工具调用阶段路径如图4所示,其中LLM(Large Language Mode)为大语言模型。
图4 大模型外部工具调用[27]

Fig.4 Usage of external tools for large language models[27]

(1)在任务规划阶段,模型需将用户复杂查询拆解为可执行子任务。思维链可以协助大模型更好地处理复杂任务,借助提示工程用大模型自身的推理能力来分解任务[12-13];通过多回合自我思考,递归或迭代生成子问题,得到模型的调用计划[26]。大模型微调也是任务规划过程中的有效途径,通过标注或合成任务分析训练数据微调大模型,使其获得领域内的人工规划能力[28-31]。该阶段关键在于精准区分工具调用需求与模型内部推理需求,避免过度分解导致的效率损耗。
(2)在工具匹配阶段,大模型需要在多个可用工具中检索并选择最合适的工具。不同工具的功能、输入输出方式、调用代价不同,正确选择不同工具组合对于解决子任务至关重要。当工具规模比较庞大,通常先配备一个外部检索器筛选Top-K相关工具,再把他们的描述与用户子问题一并输入大模型,最终由大模型判别,以提高工具搜索的覆盖率与准确性[32-35]。若调用的工具数量适当,可直接将工具描述嵌入提示词,利用链式思维引导模型选择[26,36-37]。该阶段需平衡检索精度与工具协同性,解决在上下文限制的情况下工具调用与任务需求匹配的问题。
(3)在工具调用阶段,大模型以正确格式发起调用请求并填充参数。免微调策略依赖提示示例或规则模板约束输出结构[38-40],而微调方法通过真实调用数据训练模型生成合规API参数,并融入错误处理机制[41-42]。该阶段由于工具接口规范差异大,确保参数完整性与安全性、设计自适应纠错机制为核心挑战。
(4)在方案生成阶段,大模型需将工具输出整合为用户友好的答案。常见的做法是将工具结果作为上下文输入模型,让它基于这个信息写出完整、自然的叙述式答案[43];当工具输出过大,超出大模型的上下文窗口时,可以考虑先对工具结果进行压缩或抽取,通过压缩模型提取关键信息表,再让大模型据此生成答复[44];或者采用多轮问答,按需获取或处理数据[45]。该阶段需解决输出格式多样性与模型上下文限制的矛盾,同时提升答案可解释性与用户体验。

3 思路架构与流程剖析

本节旨在构建一套具有普适性与创新性的大模型与水文模型耦合的思路框架,考虑分析单向耦合和双向耦合的具体执行流程,为复杂水文过程研究提供可复用的方法。
在实际应用场景中,自然流域与城市建成区作为典型下垫面类型,其产汇流机制存在显著差异。选取自然下垫面与城市下垫面入汇湖泊的复合水文过程(如图5所示)作为研究对象,自然下垫面采用SWAT(Soil and Water Assessment Tool)模型模拟,城市下垫面采用SWMM(Storm Water Management Model)模拟。针对不同地区的水文条件,水文模型已率定采用单向耦合方式分析,水文模型待率定则采用双向耦合方式分析。
图5 湖泊水文过程影响

Fig.5 Impact on lake hydrological processes

3.1 单向耦合思路架构

在单向耦合思路架构中,水文模型已经完成率定,大模型主要任务是前端的任务理解、模型驱动数据的自动获取与准备、水文模型调用逻辑构建,以及后端的水文模型输出结果的专业化解读和应急方案生成。针对“未来5 d有连续的大暴雨,预测未来5 d湖泊的洪水演进过程”的用户问题,提出单向耦合过程包括任务规划、工具匹配调用、结果生成等3个环节(如图6所示)。
图6 单向耦合思路架构

Fig.6 Architectural framework of unidirectional coupling

任务规划:查询知识库、工具集和历史方案库获知湖泊上游有6个汇水区,其中A、B、C汇水区为自然下垫面,建有SWAT模型可调用;D、E、F为城市下垫面,建有SWMM可调用;湖泊建有MIKE21水动力模型可调用。模拟未来5 d湖泊洪水演进过程,依次完成以下任务:
(1)获取未来5 d SWAT、SWMM、MIKE21模型所需的气象数据。
(2)整理气象数据为相应模型输入数据格式,更新模型输入数据。
(3)读取SWAT、SWMM、MIKE21参数库,并修改模拟步长为1 h、模拟时间T为00:00与T+5为24:00。
(4)将SWAT模型和SWMM模拟结果作为边界条件输入MIKE21模型模拟湖泊洪水演进过程。
(5) 基于湖泊MIKE21模拟结果,进行应急方案的生成。
工具匹配调用:
(1)通过华为云气象服务API接口获取未来5 d气象数据。
(2)调用数据预处理工具对气象数据进行缺失值补充和规范化处理;调用SWAT、SWMM和MIKE21模型的气象数据输入文件更新工具,完成SWAT模型.wgn文件、SWMM.inp文件、MIKE21模型.dfs0文件的气象数据更新。
(3)调用3个模型时间配置工具,将SWAT模型.cio文件、SWMM.inp文件和MIKE21的.prj文件中起止时间设置为T=00:00、T+5=24:00;模拟时间步长设置为1 h。
(4)调用SWAT模型和SWMM进行模拟;调用模拟结果读取工具,读取A—F汇流区对应模型逐小时流量数据;在MIKE21网格地图中定位SWAT、SWMM出口位置,将6个汇流区逐小时流量数据转为.dfs1文件(1维边界)输入MIKE21模型;调用MKIE21模型模拟湖泊洪水演进过程。
(5)调用MIKE21模拟结果读取工具,读取水位、淹没深度等数据;调用数据解读工具,生成洪水演进动画、最大水深分布图、水位时程曲线等。
结果生成:结合模拟数据的分析结果,以及应急方案文本库、历史案例库、应急处理处置规则库等,生成应急方案。

3.2 双向耦合思路架构

在双向耦合思路架构中,水文模型在模拟过程中可能会遇到一些突发情况,如降雨强度超过模型率定验证数据最大值、上游滑坡阻塞河道、湖泊决堤、城市排涝泵站应急排水等,致使模型参数失效,模拟结果与实测值出现严重偏差,需要在极短时间内重新率定模型。相较于单向耦合,双向耦合特有功能是大模型与水文模型的交互,如通过对模拟数据和实测数据的实时校对发现模拟偏差,结合历史文本、案例知识库和实时信息,分析偏差原因,制定模型调优方案,通过优化算法进行模型迭代调优,对模型优化结果进行评价。
针对上述单向耦合思路架构下的问题继续提问:在暴雨持续的第3天,湖泊实测水位上升速度比模拟水位快很多,请分析原因,并做调整,根据调整后的模型计算结果,更新应急方案。双向耦合过程包括任务规划、工具调用、结果生成等3个环节的迭代优化(如图7所示)。
图7 双向耦合思路架构

Fig.7 Architectural framework of bidirectional coupling

任务规划:分析湖泊实测水位与模拟水位出现偏差的原因,包括预测用降雨数据与实测数据是否有偏差;上游6个汇流区模拟结果是否有偏差;MIKE21模型模拟参数是否准确。为此需完成以下任务:
(1)读取过去3 d的实测气象数据以及模型模拟预测试时前3 d预测气象数据,对比降雨量及雨型,分析降雨可能产生的影响。
(2)读取6个汇流区入湖口模拟数据与实测数据,对比分析6个汇流区模拟准确度。
(3)若上述2个步骤均未找到原因,再复核MIKE21模拟参数。
工具匹配调用:
(1)调用华为云气象服务API接口获取前3 d实测降雨数据;调用模型驱动数据读取工具获取气象数据;调用数值分析工具,分析雨量、雨型信息。
(2)调用SWAT和SWMM模拟结果读取工具,获取前3 d 的6个汇流区预测流量;调用6个汇流区入湖口流量监测数据库,获取实测流量数据;调用数值分析工具,分析6个汇流区实测和预测流量区别。
结果生成:根据实测及预测雨量、雨型结果对比,降雨基本一致,排除降雨原因;根据6个汇流区入湖口实测及预测流量分析结果,自然下垫面预测结果偏小,城市下垫面预测结果普遍偏大,汇集最新实时信息,由于前3 d降雨量过大,城市形成大片内涝区域,沿河各片区启用了移动强排泵站并加大了固定排涝站的排涝量,初步判别城市排水系统调度规则的改变以及移动排涝泵站的启用,导致入湖水量增加,引起湖泊预测与实测水位出现偏差。
重新规划任务:针对城市排水系统调度规则改变及移动泵站启用导致湖泊模拟水位失真问题,重新更改城市片区SWMM中泵站调度规则,获取移动泵站点位和排涝能力信息,增加临时排水通道,并对3个城市片区SWMM参数进行重新率定和验证。
重新工具匹配调用:
(1)根据获取的移动本站坐标信息,调用SWMM模型.inp文件更新工具,增加移动泵站点位;更新既有泵站调度规则,增加移动泵站调度规则。
(2)调用3个城市汇水区SWMM进行流量模拟;调用模型参数自动优化工具,对模型参数进行率定和验证;调用SWAT、调整后的SWMM模拟结果,更新MIKE21模型输入文件;调用MIKE21模型,模拟湖泊水位信息;调用数据读取工具,获取实测数据及模拟数据;调用数据分析工具,分析实测和预测水位,分析预测准确度。
结果生成:更新后的模型预测结果与实测结果偏差较小,确认是城市汇流区泵站调度规则改变和移动泵站启用引发上述问题。基于调整后的模型,重新推演未来2 d湖泊洪水演进过程,结合模拟数据分析结果、应急方案文本库、历史案例库、应急处理处置规则库等,更新应急方案。若模拟结果与预测结果偏差仍较大,则MIKE21模型模拟结果可能也出现了误差,需要大模型进一步反思,与MIKE21模型进行交互,以解决问题。

4 总结与展望

大模型与水文模型协同技术经过不断探索和研究,初步展现了大模型与水文模拟、预测相结合的应用潜力。大模型通过语义解析、参数动态率定与多模型协同调度能力优势,拓展了水文模型在实时交互响应、跨尺度耦合模拟以及应急决策支持等方面的功能边界。这种融合不仅以智能接口形式降低了专业水文模型的应用门槛,更以动态参数优化与协同计算机制提升了复杂水文过程模拟的效率和应急决策的精准性。二者协同展现出对新型环境条件的快速适配能力与自主推理优化特性,为建立“感知—模拟—决策”全链贯通的数字孪生流域体系开辟了创新路径。
大模型与水文模型协同技术的发展还面临着诸多挑战,未来研究重点:①构建融合物理机理与领域知识的水文基础大模型,通过水利专业语料库建设、物理约束预训练方法创新,突破通用大模型在水文参数辨识、任务推理等专业场景的认知局限。②面向流域防洪、城市内涝等现实应用场景,建立大模型与水文模型协同的应用框架;针对区域供水管网拓扑特征、特定流域下垫面异质性等要素,通过MCP等方式,实现大模型与水文模型协同应用;通过数据计算和实验分析,进一步验证大模型与水文模型协同的有效性和可行性。③实现协同平台的工程化落地,构建出集模型训练、仿真推演与决策优化于一体的智能中枢系统,有效降低应用门槛。
[1]
罗贤, 李运刚, 季漩, 等. 中国国际河流水文地理研究进展[J]. 地理学报, 2023, 78(7):1703-1717.

DOI

(LUO Xian, LI Yun-gang, JI Xuan, et al. Progresses in Hydrographic Research on International Rivers in China[J]. Acta Geographica Sinica, 2023, 78(7):1703-1717. (in Chinese))

DOI

[2]
罗文兵, 王修贵, 乔伟, 等. 基于水文水动力耦合模型的平原湖区土地利用变化对排涝模数的影响[J]. 长江科学院院报, 2018, 35(1): 76-81.

DOI

(LUO Wen-bing, WANG Xiu-gui, QIAO Wei, et al. Effects of Land-use Change on Drainage Modulus in Plain Lake Area Based on a Coupled Hydrological and Hydrodynamic Model[J]. Journal of Yangtze River Scientific Research Institute, 2018, 35(1): 76-81. (in Chinese))

DOI

[3]
苟娇娇, 缪驰远, 徐宗学, 等. 大尺度水文模型参数不确定性分析的挑战与综合研究框架[J]. 水科学进展, 2022, 33(2): 327-335.

(GOU Jiao-jiao, MIAO Chi-yuan, XU Zong-xue, et al. Parameter Uncertainty Analysis for Large-scale Hydrological Model: Challenges and Comprehensive Study Framework[J]. Advances in Water Science, 2022, 33(2): 327-335. (in Chinese))

[4]
KOUSSIS A D, LAGOUVARDOS K, MAZI K, et al. Flood Forecasts for Urban Basin with Integrated Hydro-meteorological Model[J]. Journal of Hydrologic Engineering, 2003, 8(1): 1-11.

DOI

[5]
张赛亚, 张珂, 晁丽君, 等. 考虑地形与理化性质的土壤关键水力特性多种模型构建与比较[J]. 河海大学学报(自然科学版), 2024, 52(3): 42-50.

(ZHANG Sai-ya, ZHANG Ke, CHAO Li-jun, et al. Development and Comparison of Multiple Models for Estimating Key Soil Hydraulic Properties Considering Terrain and Soil Physiochemical Properties[J]. Journal of Hohai University (Natural Sciences), 2024, 52(3):42-50. (in Chinese))

[6]
郭怡, 吴鑫淼, 郄志红, 等. 基于BP神经网络的MIKE SHE模型参数率定[J]. 长江科学院院报, 2019, 36(3): 26-30.

DOI

(GUO Yi, WU Xin-miao, QIE Zhi-hong, et al. Parameter Calibration of MIKE SHE Model Based on BP Neural Network[J]. Journal of Yangtze River Scientific Research Institute, 2019, 36(3): 26-30. (in Chinese))

DOI

[7]
李琳, 文雄飞, 谭德宝, 等. 盐湖流域空-天-地立体监测系统结合VIC模型径流模拟初探[J]. 长江科学院院报, 2022, 39(8):126-132.

DOI

(LI Lin, WEN Xiong-fei, TAN De-bao, et al. A Preliminary Study on Runoff Simulation of Salt Lake Basin with the Air-space-ground Stereoscopic Monitoring System and VIC Model[J]. Journal of Yangtze River Scientific Research Institute, 2022, 39(8): 126-132. (in Chinese))

DOI

[8]
李晓英, 张金辉, 赵洪杰. CASC2D水文模型参数全局敏感性分析[J]. 长江科学院院报, 2025, 42(6):111-117.

DOI

(LI Xiao-ying, ZHANG Jin-hui, ZHAO Hong-jie. Global Sensitivity Analysis of CASC2D Hydrological Model Parameters[J]. Journal of Changjiang River Scientific Research Institute, 2025, 42(6): 111-117. (in Chinese))

[9]
汪涛, 徐杨, 曹辉, 等. 基于LSTM的三峡-葛洲坝梯级电站超短期水位预测[J]. 长江科学院院报, 2025, 42(4):80-86.

DOI

(WANG Tao, XU Yang, CAO Hui, et al. Ultra-short-term Water Level Forecasting for the Three Gorges-Gezhouba Cascade Hydropower Stations Based on LSTM[J]. Journal of Changjiang River Scientific Research Institute, 2025, 42(4): 80-86. (in Chinese))

[10]
由宇军, 白云岗, 卢震林, 等. 缺资料地区可解释性混合机器学习模型中长期径流预报[J]. 长江科学院院报, 2025, 42(7):52-59.

DOI

(YOU Yu-jun, BAI Yun-gang, LU Zhen-lin, et al. Medium and Long-term Runoff Forecasting Using Explainable Hybrid Machine Learning Models in Data-scarce Areas[J]. Journal of Changjiang River Scientific Research Institute, 2025, 42(7): 52-59. (in Chinese))

[11]
兰小机, 贺永兰, 武帅文. 基于RF-BiLSTM模型的河流水质预测[J]. 长江科学院院报, 2024, 41(7):57-63,71.

DOI

(LAN Xiao-ji, HE Yong-lan, WU Shuai-wen. River Water Quality Prediction Based on RF-BiLSTM Model[J]. Journal of Changjiang River Scientific Research Institute, 2024, 41(7): 57-71. (in Chinese))

[12]
WEI J, WANG X, SCHUURMANS D, et al. Chain-of-thought Prompting Elicits Reasoning in Large Language Models[J]. Advances in Neural Information Processing Systems, 2022, 35: 24824-24837.

[13]
YAO S, YU D, ZHAO J, et al. Tree of Thoughts: Deliberate Problem Solving with Large Language Models[J]. Advances in Neural Information Processing Systems, 2023, 36: 11809-11822.

[14]
BESTA M, BLACH N, KUBICEK A, et al. Graph of Thoughts: Solving Elaborate Problems with Large Language Models[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2024, 38(16): 17682-17690.

DOI

[15]
SANMARTIN D. KG-RAG: Bridging the Gap Between Knowledge and Creativity[J]. Doi: 10.48550/arXiv.2405.12035.

[16]
MEI T, RUI Y, LI S, et al. Multimedia Search Reranking: A Literature Survey[J]. ACM Computing Surveys, 2014, 46(3): 1-38.

[17]
HU E J, SHEN Y, WALLIS P, et al. LoRa: Low-Rank Adaptation of Large Language Models[C]//Proceedings of the 10th International Conference on Learning Representations (ICLR). April 25-29, 2022, Doi: 10.48550/arXiv.2106.09685.

[18]
DETTMERS T, PAGNONI A, HOLTZMAN A, et al. QloRA: Efficient Finetuning of Quantized LLMs[J]. Advances in Neural Information Processing Systems, 2023, 36: 10088-10115.

[19]
RADFORD A, WOOK J, ADITYA H, et al. CLIP: Learning Transferable Visual Models from Natural Language Supervision[J]. Doi: 10.48550/arXiv.2103.00020.

[20]
HUANG Y, ZHANG Q, SUN L. TrustGPT: A Benchmark for Trustworthy and Responsible Large Language Models[J]. Doi: 10.48550/arXiv.2306.11507.

[21]
HUANG Y, XIONG D. CBBQ:A Chinese Bias Benchmark Dataset Curated with Human-Ai Collaboration for Large Language Models[C]// Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). Torino, Italia. May 20-25, 2024: 2917-2929.

[22]
LIU W, HUANG X, ZENG X, et al. ToolAce: Winning the Points of LLM Function Calling[J]. Doi: 10.48550/arXiv.2409.00920.

[23]
HOU X, ZHAO Y, WANG S, et al. Model Context Protocol (MCP): Landscape, Security Threats, And Future Research Directions[J]. Doi: 10.48550/arXiv.2503.23278.

[24]
LUAN G, HOU J, WANG T, et al. A 1D-2D Dynamic Bidirectional Coupling Model for High-resolution Simulation of Urban Water Environments Based on GPU Acceleration Techniques[J]. Journal of Cleaner Production, 2023, 428: 139494.

DOI

[25]
SHEN Y, ZHOU Q, JIANG C. A Dynamic Bidirectional Coupling Model for Watershed Water Environment Simulation Based on the Multi-grid Technique[J]. Science of The Total Environment, 2022, 843: 156760.

DOI

[26]
YAO S, ZHAO J, YU D, et al. ReAct: Synergizing Reasoning and Acting in Language Models[J]. Doi: 10.48550/arXiv.2210.03629.

[27]
QU C, DAI S, WEI X, et al. Tool Learning with Large Language Models: A Survey[J]. Frontiers of Computer Science, 2025, 19(8): 198343.

DOI

[28]
SCHICK T, DWIVEDI-YU J, DESSI R, et al. Toolformer: Language Models Can Teach Themselves To Use Tools[C]. Doi: 10.48550/arXiv.2302.04761.

[29]
QIAN C, XIONG C, LIU Z, et al. Toolink: Linking Toolkit Creation and Using Through Chain-of-Solving on Open-Source Model[C]. Doi: 10.18653/v1/2024.naacl-long.48.

[30]
KONG Y, RUAN J, CHEN Y, et al. TPTU-v2: Boost ing Task Planning and Tool Usage of Large Language Model-based Agents in Real-World Systems[J]. Doi: 10.48550/arXiv.2311.11315.

[31]
SHEN W, LI C, CHEN H, et al. Small LLMs are Weak Tool Learners: A Multi LLM Agent[J]. Doi: 10.48550/arXiv.2401.07324.

[32]
GAO L, CALLAN J. Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval[C]//Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Dublin, Ireland. Stroudsburg, PA, USA: ACL, 2022: 2843-2853.

[33]
YUAN L, CHEN Y, WANG X, et al. CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets[C]. Doi: 10.48550/arXiv.2309.17428.

[34]
ANANTHA R, BANDYOPADHYAY B, KASHI A, et al. ProTIP: Progressive Tool Retrieval Improves Planning[J]. Doi: 10.48550/arXiv.2312.10332.

[35]
ZHENG Y, LI P, LIU W, et al. Tool Rerank: Adaptive and Hierarchy-Aware Reranking for Tool Retrieval[C]// Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). Torino,Italy.May 20-25,2024:16263-16273.

[36]
XU Q, HONG F, LI B, et al. On the Tool Manipulation Capability of Open-Source Large Language Models[J]. Doi: 10.48550/arXiv.2305.16504.

[37]
CHENG Y, CHEN J, HUANG Q, et al. Prompt Sapper: A LLM-empowered Production Tool for Building AI Chains[J]. ACM Transactions on Software Engineering and Methodology, 2024, 33(5): 1-24.

[38]
SONG Y, XIONG W, ZHU D, et al. RestGPT: Connecting Large Language Models with Real-World Applications via Restful APIs[J]. Doi: 10.48550/arXiv.2306.06624.

[39]
ZHANG Y, CAI H, CHEN Y, et al. Reverse Chain: A Generic-Rule for LLMs to Master Multi-API Planning[J]. Doi: 10.48550/arXiv.2310.04474.

[40]
YUAN S, SONG K, CHEN J, et al. EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction[J]. Doi: 10.48550/arXiv.2401.06201.

[41]
YANG R, SONG L, LI Y, et al. GPT4Tools:Teaching Large Language Model to Use Tools via Self-instruction[J]. Doi: 10.48550/arXiv.2305.18752.

[42]
MEKALA D, WESTON J, LANCHANTIN J, et al. TOOLVERIFIER: Generalization to New Tools via Self-Verification[J]. Doi: 10.48550/arXiv.2402.14158.

[43]
QIN Y, LIANG S, YE Y, et al. ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs[J]. Doi: 10.48550/arXiv.2307.16789.

[44]
XU F, SHI W, CHOI E. RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation[C]. Doi: 10.48550/arXiv.2310.04408.

[45]
SHI Z, GAO S, CHEN X, et al. Learning to Use Tools via Cooperative and Interactive Agents[J]. Doi: 10.48550/arXiv.2403.03031.

文章导航

/