Python实现json对值进行模糊搜索的示例详解

 更新时间:2023年01月29日 14:05:38   作者:奥怪的小栈  
我经常使用json进行存储配置,于是常常遇到这样的问题:如果想要对某个数组里的值进行模糊搜索,同时输出相关的其他数组相同位置的的值该如何实现呢?本文就来和大家详细聊聊

我经常使用json进行存储配置,于是常常遇到这样的问题:如果想要对某个数组里的值进行模糊搜索,同时输出相关的其他数组相同位置的的值该如何实现呢?

思路

代入实际案例来思考一下我的解法

数据

{
    "name": [
        "电饭煲版广式腊肠煲饭",
        "电饭煲烧鸡",
        "电饭煲焖面"],
    "ingredients": [
        "腊肠、米",
        "鸡肉、洋葱、菌菇",
        "猪肉、面食"],
    "url": [
        "https://www.***.com/video/BV1NE411Q7Jj",
        "https://www.***.com/video/BV1T54y1U7Cu",
        "https://www.***.com/video/BV14b411q7rM"
        "https://www.***.com/video/BV1K441157rz"],
    "difficulty": [
        "简单",
        "简单",
        "简单"],
    "tag": [
        "广式",
        "好吃",
        "健康餐"],
    "practice": [
        "炒",
        "烧",
        "蒸"
        ""],
    "tool": [
        "电饭煲",
        "电饭煲",
        "电饭煲"
        ""]
}

这是一个菜谱json。

假如我现在被隔离在家了,手头上只有零星的食材,我想根据手头上的食材来看看我都能做出什么菜。

那么这该如何实现呢?

解法一

假如已知我手上的食物有牛肉、洋葱。那么我可以这样实现

  • 遍历json,然后分别创建数组变量存储name、ingredients、url、difficulty等json数组内容
  • 遍历ingredients数组,模糊匹配是否与我手头上的食物一致
  • 如果一致,将数据加入新的数组中,同时把相同位置的name、url、difficulty等json数组内容也分别加入新的数组中
  • 同时输出各个数组的内容
    显而易见,这种解法太呆了,于是我想还有哪里可以优化呢?

解法二

于是我又想到了另一种写法

  • 只遍历一次json并存储,然后再存储一组需要模糊匹配的内容数组(这个内容数组可以是你想匹配的任何值所在的对应数组,例如想模糊匹配菜名,就只需要存储name数组,想模糊匹配食材,就只需要存储ingredients数组)
  • 模糊匹配是否与我手头上的食物一致并记录下位置
  • 通过位置取其他相关的其他数组相同位置的的值

这个解法的关键在于,因为各个数组的长度相同,所以获取一次位置即可同时知道其他对应数值所在的对应数组中的位置
说的有点绕,直接上代码。

代码实现

首先取菜谱数据

# 取菜谱json
def get_record():
    url = "./menu.json"
    if not os.path.isfile(url):
        return "菜谱获取失败"
    fo = open(url, "r", encoding='utf-8')
    ele_json = loads(fo.read())
    return ele_json

模糊搜索实现

# 模糊搜索
def fuzzyfinder(user_input, collection_key_list):
    suggestions = []
    pattern = '.*?'.join(user_input)  # Converts 'djm' to 'd.*?j.*?m'
    regex = compile(pattern)  # Compiles a regex.
    a = 0
    for item in collection_key_list:
        match = regex.search(item)  # Checks if the current item matches the regex.
        if match:
            suggestions.append(a)
        a = a + 1
    return suggestions

user_input 和 collection_key_list 分别表示 关键字 和 欲模糊匹配的数组suggestions数组 存储了模糊匹配上了的数值的位置

最后根据实际情况进行数据取出使用即可。

在本例子里,就是取出菜谱

def get_cook(key):
    # 进一步解析资源json
    al_dict = get_record()
    collection_key = []  # 用来模糊匹配的key
    for b in al_dict['ingredients']:
        collection_key.append(b)
    fuzzyfinder_i_list = fuzzyfinder(key, collection_key)  # 模糊搜索资源
    fuzzyfinder_i_len = len(fuzzyfinder_i_list)
    if fuzzyfinder_i_len > 0:
        if collection_key[fuzzyfinder_i_list[0]].replace("、", "") == key.replace("、", ""):
            return "".join([al_dict['name'][fuzzyfinder_i_list[0]], "丨", al_dict['ingredients'][fuzzyfinder_i_list[0]],
                            "\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[0]], "\n难度:",
                            al_dict['difficulty'][fuzzyfinder_i_list[0]], "丨标签:", al_dict['tag'][fuzzyfinder_i_list[0]],
                            "\n方法:", al_dict['practice'][fuzzyfinder_i_list[0]], "丨工具:",
                            al_dict['tool'][fuzzyfinder_i_list[0]]])
        elif collection_key[fuzzyfinder_i_list[fuzzyfinder_i_len - 1]].replace("、", "") == key.replace("、", ""):
            return "".join([al_dict['name'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨",
                            al_dict['ingredients'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
                            "\nB站教程BV号:", al_dict['url'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "\n难度:",
                            al_dict['difficulty'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨标签:",
                            al_dict['tag'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]],
                            "\n方法:", al_dict['practice'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]], "丨工具:",
                            al_dict['tool'][fuzzyfinder_i_list[fuzzyfinder_i_len - 1]]])
        else:
            re_text = "未找到精准关键词,模糊搜索到以下内容:\n"
            for c in fuzzyfinder_i_list:
                re_text = "".join(
                    [re_text, al_dict['name'][c], "丨", al_dict['ingredients'][c], "\nB站教程BV号:",
                     al_dict['url'][c], "\n难度:", al_dict['difficulty'][c],
                     "丨标签:", al_dict['tag'][c], "\n方法:", al_dict['practice'][c],
                     "丨工具:", al_dict['tool'][c], "\n"])

            return re_text
    else:
        content = "".join(["未找到" + key + "相关菜谱"])
        return content

这个写法可以同时解决精准匹配和模糊匹配问题,精准匹配结果一般是数组第一个或最后一个,所以只需要判断一下首尾是否与关键字相同即可

结果

来看一下效果

精准匹配

if __name__ == "__main__":
    print(get_cook("胡萝卜、牛肉、洋葱"))
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>方法:炖丨工具:一口大锅

模糊匹配

if __name__ == "__main__":
    print(get_cook("牛肉、洋葱"))
>>>未找到精准关键词,模糊搜索到以下内容:
>>>电饭煲罗宋汤丨牛肉、番茄、洋葱、芹菜、胡萝卜、土豆、卷心菜
>>>B站教程BV号:https://www.***.com/video/BV16Q4y1m7nU
>>>难度:简单丨标签:杂烩
>>>方法:丨工具:电饭煲
>>>胡萝卜炖牛肉丨胡萝卜、牛肉、洋葱
>>>B站教程BV号:https://www.***.com/video/BV1UR4y1V7nV
>>>难度:困难丨标签:法式
>>>...

问题解决

到此这篇关于Python实现json对值进行模糊搜索的示例详解的文章就介绍到这了,更多相关Python json值模糊搜索内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用python调用llama3进行对话的操作步骤

    使用python调用llama3进行对话的操作步骤

    Meta 已将最新的 LLaMa3 进行了开源,因此,我们也可以方便的使用 Python 进行 LLaMa3 模型的调用和开发,本文给大家介绍了如何使用 python 调用 llama3 进行对话,需要的朋友可以参考下
    2024-09-09
  • pygame编写音乐播放器的实现代码示例

    pygame编写音乐播放器的实现代码示例

    这篇文章主要介绍了pygame编写音乐播放器的实现代码示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • DJANGO-URL反向解析REVERSE实例讲解

    DJANGO-URL反向解析REVERSE实例讲解

    在本篇文章里小编给大家整理的是一篇关于DJANGO-URL反向解析REVERSE的相关知识点内容,需要的朋友们学习下。
    2019-10-10
  • python中的字典详细介绍

    python中的字典详细介绍

    这篇文章主要介绍了python中的字典详细介绍,字典是Python中最强大的数据类型之一,本文讲解了什么是字典、创建字典和给字典赋值 、字典的基本操作、映射类型操作符、映射相关的函数、字典的方法等内容,需要的朋友可以参考下
    2014-09-09
  • 利用Python实现面部识别的方法详解

    利用Python实现面部识别的方法详解

    人脸识别正在成为软件开发中的一种趋势。它有助于识别人脸并使应用程序更加健壮。本文将使用python和face_recognition库创建一个简单的人脸识别,需要的可以参考一下
    2022-05-05
  • 详解Python字典的操作

    详解Python字典的操作

    在本文里小编给大家整理了关于Python字典的相关知识点以及操作方式,有兴趣的朋友们学习下。
    2019-03-03
  • 全面了解Python的getattr(),setattr(),delattr(),hasattr()

    全面了解Python的getattr(),setattr(),delattr(),hasattr()

    下面小编就为大家带来一篇全面了解Python的getattr(),setattr(),delattr(),hasattr()。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-06-06
  • 关于CUDA out of memory的解决方案

    关于CUDA out of memory的解决方案

    这篇文章主要介绍了关于CUDA out of memory的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • python 寻找优化使成本函数最小的最优解的方法

    python 寻找优化使成本函数最小的最优解的方法

    这篇文章主要介绍了python 寻找优化使成本函数最小的最优解的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-12-12
  • 在Django中输出matplotlib生成的图片方法

    在Django中输出matplotlib生成的图片方法

    今天小编就为大家分享一篇在Django中输出matplotlib生成的图片方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05

最新评论