匹配相似功能说明

“匹配相似”功能利用模糊算法,在两组数据之间寻找最接近的项。它能帮您解决由于输入不规范、简写、错别字导致的数据无法对齐问题。

1. 核心功用

解决“张三”匹配“张三(技术部)”、“李四”匹配“李家老四”等模糊对应场景。

示例对比

标准库(数据源): [北京, 上海, 广州, 深圳] 输入项: 北极、广州市

匹配结果:

ABC
1输入项匹配结果1相似度1
2北极北京50%
3广州市广州66%

2. 操作步骤

  1. 准备标准库(数据源): 这是用来被比对的“底稿”。

    • 模式一(Excel读取):在 Excel 中选中标准数据列(如:城市列表),再点击 源数据[获取] 按钮。
    • 模式二(文件加载):点击 浏览 直接选择一个外部Excel文件作为底稿,该文件首行必须有一个列名为标准名称
  2. 设置待匹配项: 这是您手中需要去匹配底稿的数据。

    • 操作方法:先在 Excel 中选中包含“广州市”等文字的查询列,再点击[获取]按钮。
  3. 配置参数

    • 返回项个数:设置要返回相似度最高的前几项(如设为 1 则只返回最像的那一项)。
    • 匹配规则:共4个规则,各有优劣,但一般就默认的**精准匹配**即可。
  4. 指定写入位置

    • 操作方法:先在 Excel 中点击结果存放的第一个空白单元格,再点击 写入地址 旁的 [获取] 按钮。
  5. 开始执行: 点击 [智能匹配]


3. 注意事项

  • 去重处理:系统会自动去除标准库中的空行和完全重复行。
  • 匹配实质:本质是从文字相似度来匹配,因此对于同一个东西,但名称的文字完全不像的东西,无法匹配
  • 耗时提示:匹配大量数据时(如万级以上),耗时会显著增加,请耐心等待。