https://git.aimap.io/ai/address_process.git

行政区划比对 admin_compare.py

小区实体多分类接口 community_entity_classfy.py

地址解析接口 request_split_api.py

0. 获取结构化地址数据

(如果项目未提供结构化地址字段)

输入: 待治理的地址文本

输出:address_raw + province + city + district + township + neighborhood + road + house_number + community + …

【程序】knowledge_new/知识库生成前准备/request_split_api.py

1. 确定五级行政区划

输入:项目提供的五级行政区划, 国家统计局的五级行政区划

输出:知识库使用的五级行政区划

可能用到的程序/函数:

【程序】

末尾字符权重降低计算相似度

knowledge_new/知识库生成前准备/public_functions.py calculate_similarity_limit

bi-gram计算相似度:

knowledge_new/知识库生成前准备/public_functions.py compute_bigram_similarity

2. 小区表的构建