匹配相似功能说明
“匹配相似”功能利用模糊算法,在两组数据之间寻找最接近的项。它能帮您解决由于输入不规范、简写、错别字导致的数据无法对齐问题。
1. 核心功用
解决“张三”匹配“张三(技术部)”、“李四”匹配“李家老四”等模糊对应场景。
示例对比
标准库(数据源): [北京, 上海, 广州, 深圳]
输入项: 北极、广州市
匹配结果:
| A | B | C | |
|---|---|---|---|
| 1 | 输入项 | 匹配结果1 | 相似度1 |
| 2 | 北极 | 北京 | 50% |
| 3 | 广州市 | 广州 | 66% |
2. 操作步骤
-
准备标准库(数据源): 这是用来被比对的“底稿”。
- 模式一(Excel读取):在 Excel 中选中标准数据列(如:城市列表),再点击
源数据的[获取]按钮。 - 模式二(文件加载):点击
浏览直接选择一个外部Excel文件作为底稿,该文件首行必须有一个列名为标准名称。
- 模式一(Excel读取):在 Excel 中选中标准数据列(如:城市列表),再点击
-
设置待匹配项: 这是您手中需要去匹配底稿的数据。
- 操作方法:先在 Excel 中选中包含“广州市”等文字的查询列,再点击
[获取]按钮。
- 操作方法:先在 Excel 中选中包含“广州市”等文字的查询列,再点击
-
配置参数:
返回项个数:设置要返回相似度最高的前几项(如设为1则只返回最像的那一项)。匹配规则:共4个规则,各有优劣,但一般就默认的**精准匹配**即可。
-
指定写入位置:
- 操作方法:先在 Excel 中点击结果存放的第一个空白单元格,再点击
写入地址旁的[获取]按钮。
- 操作方法:先在 Excel 中点击结果存放的第一个空白单元格,再点击
-
开始执行: 点击
[智能匹配]。
3. 注意事项
- 去重处理:系统会自动去除标准库中的空行和完全重复行。
- 匹配实质:本质是从文字相似度来匹配,因此对于同一个东西,但名称的文字完全不像的东西,无法匹配
- 耗时提示:匹配大量数据时(如万级以上),耗时会显著增加,请耐心等待。