吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1544|回复: 14
收起左侧

[Python 原创] 利用python对excel进行模糊匹配,彻底告别Vlookup函数

[复制链接]
Eks6666 发表于 2024-7-29 09:58
[Python] 纯文本查看 复制代码
import pandas as pd
# from jieba import posseg  # 用于中文分词


def chinese_char_count(some_string):
    return len([c for c in some_string if c >= '\u4e00'])


def match_by_similarity(df, full_col, kw_col, len_threshold=3):
    result_list = []
    for index, row in df.iterrows():
        keywords = row[kw_col]
        print(keywords)
        keyword_words = [w for w in keywords]
        # print(keyword_words)
        for index1, row1 in df.iterrows():
            full_name = row1[full_col]
            # print(full_name)
            # 对中文进行分词
            full_name_words = [w for w in full_name]

            # 计算相同字数
            common_words = set(full_name_words) & set(keyword_words)
            # print(common_words)
            if chinese_char_count(''.join(common_words)) >= len_threshold:
                print(common_words)
                df.at[index, 'Matched'] = full_name
                break
            else:
                df.at[index, 'Matched'] = "没有匹配到"

    return df


# 读取Excel文件
df = pd.read_excel('test3.xlsx')
# 执行模糊匹配
data = match_by_similarity(df, "详细地址", "市")
print(data)

免费评分

参与人数 4吾爱币 +9 热心值 +3 收起 理由
QQ165888 + 1 谢谢@Thanks!
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
liliSpring + 1 我很赞同!
ycdcsrj + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

gison 发表于 2024-7-30 10:46
本帖最后由 gison 于 2024-7-30 10:49 编辑

这个在Excel自带的power Query里也能轻松实现

第一步: 将表格导入Power Query [ 数据-来自表格]

第二步: 合并查询为新查询
merge.png

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
luxingyu329 + 1 + 1 用心讨论,共获提升!

查看全部评分

apples1949 发表于 2024-7-29 10:49
fs2moro 发表于 2024-7-29 10:19
jiahaobai 发表于 2024-7-29 10:23
?这是匹配什么?
wjbg2022 发表于 2024-7-29 10:37
你这算是重复造车吗?
liuhaigang12 发表于 2024-7-29 10:38
没看懂  你用merge  不就行了
xgzhsd 发表于 2024-7-29 10:45
这个对使用的xlsx的样例也放一个吧
ainihd 发表于 2024-7-29 11:21
能否发个成品
wangziqiu1122 发表于 2024-7-29 11:49

认真学习
chewenbin1234 发表于 2024-7-29 12:45
围观学习,谢谢发布
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-13 00:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表