2025年2月10日,由武汉大学遥感信息工程学院乐鹏教授牵头编制的OGC地理人工智能数据2项编码国际标准《OGC Training Data Markup Language for Artificial Intelligence (TrainingDML-AI) Part 2: JSON Encoding Standard》和《OGC Training Data Markup Language for Artificial Intelligence (TrainingDML-AI) Part 3: XML Encoding Standard》正式发布。(标准文档见OGC官网https://docs.ogc.org/is/24-006r1/24-006r1.html以及https://docs.ogc.org/is/24-007r1/24-007r1.html)


这2项标准是在国际开放地理信息协会(OGC)地理人工智能样本语言标准工作组(Training Data Markup Language for AI Standard Working Group,TrainingDML-AI SWG)的支持下编制。工作组主席为乐鹏教授,参与人员来自中国、美国、英国、法国等国学者和技术人员。
该标准系列针对近年来涌现的众多地理人工智能样本数据集,包括不同遥感影像智能解译任务的样本数据集,以支持数据的可发现、可访问、可互操作、可重用(FAIR原则)为目标,定义了样本数据集的数据标注与元数据表达、溯源、质量、更新等信息模型。此次发布的两项标准分别为“JSON编码标准" 和"XML编码标准"。这是继概念模型标准发布后,在数据编码层面上的进一步细化与落实。这一系列标准的建立,为地理人工智能样本数据的规范化管理、标准化共享和智能化处理奠定了重要基础。
经过近两年多的不懈努力,以及几十余次工作组成员会议的充分讨论,标准通过了OGC架构委员会审查(OAB Review)、征求公众意见(Public Comment)、技术委员会投票(TC Vote)、执行规划委员会投票(PC Vote)等多轮阶段审议与投票,获得了包括美国、欧盟、英国、加拿大、澳大利亚等机构、行业公司的广泛关注和认可,最终成功通过审查。
除标准发布以外,工作组还积极扩大该项标准的影响力,目前已有一些来自世界各国的代表性实施案例,包括PyTDML、STAC社区扩展、LuojiaSet样本库、法国GeoLabs公司TDML-as-a-service服务、欧空局AI4QC平台等。与此同时,OGC TrainingDML-AI标准正在转化为ISO 19178系列标准以及中国国家标准。在此基础上,乐鹏教授还牵头编制了行业标准《地理人工智能样本数据库建设规范》,并成功应用于国内多个行业单位,推动了标准在行业领域的落地实践。
据悉,武汉大学乐鹏教授团队已在国际进一步推动GeoAI模型标准化(https://www.ogc.org/blog-article/navigating-synthetic-imagery-trust-geospatial-data/),构建涵盖GeoAI数据、模型、质量的标准体系,以支持GeoAI技术在多领域的深入应用与发展。该标准体系的建立,将促进地理人工智能从数据标准化走向数据-模型一体化标准化,助力构建更加智能、高效的地理信息基础设施。