基于 Azure OpenAI 构建智能地址解析 Chrome / Edge 浏览器扩展插件

在电商和物流领域,有一个不起眼但极其耗时的痛点:将复杂的地址格式正确的输入到物流系统固定的字段中。客户发来的地址格式千奇百怪,有时是逗号分隔,有时连成一行,顺序也完全随机,经常还缺少省份或州等关键信息。 本文我想分享我是如何构建 Auto Address 的,这是一个利用 Azure OpenAI 的强大能力来解决这个问题的 Chrome 及 Edge 浏览器扩展插件,其界面和使用方式及其简单。 问题:非结构化数据 想象一下收到这段文本: “张三 13800138000 广东省深圳市南山区科技园南区R2-B三楼” 为了发货,你需要将其拆解为: 姓名: 张三 电话: 13800138000 地址: 科技园南区R2-B三楼 城市: 深圳市 省份: 广东省 国家: 中国 手动处理成百上千个订单既繁琐又容易出错。正则表达式(Regex)可以处理某些情况,但当格式变化或用户有错别字时,它们往往无能为力。 解决方案:LLM 作为解析器 像 Azure OpenAI(如:GPT-4 或 GPT-5)这样的大语言模型在理解上下文方面表现出色。它们能区分街道名称和城市名称,不是因为死板的规则,而是因为它们理解地址的语义。 我选择 Azure OpenAI 进行此项目主要有两个原因: 企业级隐私:发送到 Azure OpenAI 的数据不会用于训练公共模型。 可靠性:稳定的正常运行时间和性能。 技术揭秘:它是如何工作的 插件的核心逻辑出奇地简单。它获取用户的输入,并将其连同一组非常具体的指令发送到 Azure OpenAI API。 1. System Prompt (系统提示词) “魔法”在于系统提示词。我们需要确切地告诉模型要做什么,更重要的是,如何格式化输出。 这是代码中实际使用的提示词: { role: "system", content: "You are an address parser. Return ONLY a raw JSON object (no markdown code blocks) with keys: name, province, city, address, zip_code, country....

十二月 15, 2025 · 2 分钟