
在水利部加快推进水利行业高质量发展的战略布局下,武汉大学水工程科学研究院团队紧锣密鼓地开展人工智能技术的水利应用攻关,深入挖掘知识图谱、大语言模型等新技术的行业智能化场景应用,积极契合行业高质量发展需求。团队以防汛抢险决策、水工结构设计、智慧施工管理等现实需求为突破口,成功完成了领域知识图谱构建、领域大语言模型微调以及私有化部署研究。
1、水利领域知识图谱
智慧水利建设是推动新阶段水利高质量发展的关键路径之一,数字孪生则是实现传统水利业务与现代信息技术融合发展的重要举措。然而,数字孪生的知识平台尚处于初建阶段。由于水利行业知识散乱分布在标准规范、技术手册、论文专著、网络百科等多个角落,碎片化与非结构化特征突出,分散的知识极易形成知识孤岛,严重阻碍了水利知识的快速检索与高效利用。特别是在时效性要求极高的突发事件,如水利防汛抢险中,知识碎片化与非结构化的负面影响更为明显。本团队结合文本语义量化、领域知识抽取等先进的自然语言处理技术,构建了水利领域知识图谱(Knowledge Graph,KG),借助知识图谱的语义组织框架,将水利知识关联与工程经验作为数字孪生水利的知识支撑,为数字孪生知识平台建设提供技术方法与应用参考。

领域知识图谱构建流程
水利领域知识图谱中包含丰富的防汛抢险知识,可高效利用知识及知识关联,为水利设施应对潜在险情提供知识指导。它不仅能为防汛应急响应提供抢险措施查询、水利知识关联引导、共现知识推理等个性化服务,显著提升决策的科学性;还能为领域大语言模型的构建提供准确有效的知识支持。
知识图谱动态展示
2、水工结构大语言模型

在团队师生的共同奋战下,目前已基本完成首轮数据整理工作。我们对形式各异的多源水利文本展开了一系列精细处理,涵盖文字矫正、格式规整、语义分块以及数据构造等工作,为水工结构大语言模型的构建筑牢了坚实的数据基础。

领域数据收集处理要点
数据来源包括标准规范、论文专著、基础知识、操作手册、案例报告等多种行业文本,内容涵盖土石坝、拱坝、土工试验、混凝土材料等多个水利领域。

部分数据来源
经统计分析,所收集数据包含土石坝施工领域25000余条;土石方开挖、爆破领域3000余条;地基处理领域5000余条;地下工程施工领域10000余条;堤防工程施工与防洪措施领域8000余条;拱坝设计与施工领域5000余条;筑坝材料领域6000余条;大坝安全监测领域5000余条;土工试验领域4000余条;水利专有名词解释2000余条;国家水旱灾害防治战略5000余条;水利工程案例分析12000余条。共计近两千万字。

数据整理结果统计
在完成数据准备的关键工作后,团队运用SFTP、LoRA等技术,顺利完成对千问模型和 DeepSeek-R1 模型的初步微调,构建了Hydrostructure-GPT V1.0版本,向水利专业领域大语言模型开发迈出了坚实的一步。
面对土石坝日常巡视检查项目相关问题,模型能够迅速给出涵盖坝顶、坝坡、坝区等多方面细致检查内容要求,为土石坝的安全维护提供了全面的指导辅助,帮助工作人员及时发现潜在安全隐患,确保土石坝的稳定运行。
在水库枢纽工程地址勘察方面,模型可清晰阐述包括水库库区、主要坝址以及各类主要建筑物和施工临时设施场地等全面的勘察工作范围,提高了勘察规划的科学性和完整性,避免因勘察遗漏导致工程出现安全问题或其他隐患。
针对坝基隐患的处理问题,模型可给出多种专业有效的处理手段,为坝基处理提供了科学合理的解决方案,保障坝基的稳定性和安全性。
DeepSeek基座初步微调结果
3、大语言模型问答平台
大语言模型具备丰富的通用知识以及出色的语言理解和生成能力,但其存在知识更新成本高、回答易出现事实编造、缺乏可解释性等问题。与之相反,知识图谱拥有丰富的专业知识,知识系统性与关联性强,且具有显著的可解释性,领域特定知识质量高。二者恰似一枚硬币的两面,相辅相成。本团队运用图检索增强技术,以专业知识图谱为领域知识核心,以 DeepSeek-R1 为智慧载体,搭建了水工结构大语言模型问答平台。该平台可充分理解用户意图,准确检索图谱知识,深入挖掘知识内在逻辑,经分析、思考、总结整理得出最终答案,二者组合获得了 1+1>2 的出色效果。
知识问答平台
知识平台主要优势:
(1)知识查询
广泛收集规范、论文、专著、手册、报告等各类专业数据构建语料库,采用结合大语言模型的知识抽取方法搭建专业知识图谱。在知识图谱的辅助下,大语言模型回答前可通过知识图谱中结构化信息进行准确性校验,从而提高答案的准确性与可信度。同时,在图谱系统化知识的指引下,精准划定回答范围,并在回答中融入更多专业知识,有效避免冗长、模糊、空泛的回答。此外,本团队开发的知识问答平台可同时展示文字详细结果与图形简要结果,在满足不同应用场景需求的同时增强回答的可解释性。
(2)措施生成
知识图谱中的实体和关系提供了明确的推理路径,大语言模型可借助图谱中的关系链进行推理,助力生成更具逻辑性的推理性回答。例如,用户可将特定的防汛抢险背景输入大语言模型,利用大语言模型的推理能力获取条理清晰、参数明确的抢险措施。
(3)知识更新
知识图谱支持低成本动态更新来扩展新信息,当领域知识发生变化时,大语言模型通过与知识图谱结合,可及时做出反应,而无需对大语言模型本身进行大规模重新训练。基于此,大语言模型能让用户及时了解水利领域最新的研究进展和知识变化。
AI赋能水利智能发展
随着人工智能技术的迅猛发展,一个全新的时代已然来临。以上研究可为水利设施的安全稳定运行以及工程建设的科学合理规划,提供精准且高效的技术支撑。团队将持续深入钻研水利与人工智能技术交叉融合领域,致力于提高工作效率,增强决策的科学性,降低安全风险与工程成本,推动水利行业朝着智能化、精细化的方向实现高质量发展。