基于ChatGPT-4o多模态能力的街道景观变化感知评估研究——以上海为例

【字体: 时间:2025年07月25日 来源:Sustainable Cities and Society 10.5

编辑推荐:

  针对传统街道景观评估方法成本高、标准不一致的问题,研究人员创新性地结合ChatGPT-4o多模态大语言模型(MLLM)与DenseNet121深度学习技术,构建了全自动化评估框架。研究发现上海2013-2022年间街道景观改善率达70.6%,揭示了中高质量区域优先改造的空间分异规律,为可持续城市发展提供了AI赋能的决策工具。

  

随着全球城市化进程加速,街道景观正经历剧烈变迁。这种变化既带来环境品质提升的机遇,也伴随特色丧失与社区衰败的挑战。传统评估方法依赖人工问卷和专家判断,存在成本高昂、标准不一等局限,难以支撑大规模动态监测。尤其在中国上海这样的超大城市,街道兼具交通功能与社会交往空间属性,其景观变化直接影响居民健康、步行适宜性(walkability)和城市活力(vitality),亟需建立客观、高效的评估体系。

针对这一科学问题,中国某研究机构(根据CRediT声明推测为国内单位)的Yang Xiao和Yiwen Tang团队在《Sustainable Cities and Society》发表创新研究。他们首次将OpenAI最新发布的ChatGPT-4o多模态大语言模型(Multimodal Large Language Model, MLLM)应用于城市景观评估,结合DenseNet121深度学习架构,构建了从训练集生成到模型泛化的全自动化分析框架。研究采用分层空间随机抽样法,从上海6340.5 km2范围内选取4387个街景观测点,通过"gpt-4o-2024-05-13"模型分析2013-2022年景观变化方向与幅度。

关键技术包括:1)利用MLLM处理多模态(视觉-文本)数据生成初始标签;2)基于DenseNet121的密集连接结构实现特征复用;3)通过六种卷积神经网络(含ResNet50、Inception_v3等)比较验证模型性能;4)采用1e-5低学习率优化参数训练。

【Measurement on urban space visual perception】
突破传统问卷局限,通过AI解析街景图像中环境要素与人类感知的复杂关联。研究发现自然景观增强能显著提升积极情绪体验,而高密度"城市峡谷"易引发心理焦虑。

【Study area】
以上海为典型案例,其融合新旧特色的多元化街道景观和2013-2022年连续街景图像数据,为研究不同发展阶段景观演变规律提供理想样本。

【Deep Learning Model Training and Selection】
比较实验显示DenseNet121在验证集表现最优,其密集连接机制通过特征复用有效捕捉景观细微变化,准确率达70.6%。

【Discussion】
量化分析揭示:1)景观改善面积是退化面积的4倍(70.6% vs 17.6%);2)严重退化区域不足1%;3)初始质量中等区域改善最显著(45.9%),体现"马太效应"。

【Conclusions】
研究证实:1)MLLM能超越表面视觉变化,整体评估空间配置动态;2)黄浦江以西及内环内为退化集中区;3)资源分配存在"嫌贫爱富"倾向,呼吁包容性发展策略。

该研究的重要意义在于:首次实现从人工评估到AI全流程自动化的方法论突破,为SDGs(可持续发展目标)提供可扩展的技术支持。特别是发现城市更新中存在"择优改造"的空间不均衡现象,对制定兼顾效率与公平的规划政策具有警示价值。ChatGPT-4o展现的复杂多模态数据处理能力,为实时、低成本的动态城市管理开辟了新路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号