Python连接和操作Elasticsearch的详细指南

更新时间：2024年12月09日 10:21:41 作者：CoderJia_

Elasticsearch 是一个强大的搜索引擎,广泛应用于数据存储和搜索场景,通过 Python,我们可以方便地与 Elasticsearch 进行交互,本文将详细介绍如何在本地使用 Python 连接到服务器上的 Elasticsearch,并进行基本的操作,需要的朋友可以参考下

一、服务器端配置

在开始之前，确保你的 Elasticsearch 服务已经在服务器上正确安装和配置。

以下是一些基本的配置步骤：

1. 修改 Elasticsearch 配置文件

找到 Elasticsearch 的配置文件 elasticsearch.yml，并进行如下修改，以允许远程访问：

network.host: 0.0.0.0
http.port: 9200
discovery.type: single-node

2. 开放防火墙端口

确保服务器的防火墙已经开放了 Elasticsearch 的默认端口 9200。如果你使用的是云服务器，也需要在安全组中开放该端口。

你可以通过在浏览器中输入 http://<你的服务器IP>:9200 来测试是否能够正常访问 Elasticsearch。如果配置正确，你应该能看到如下 Elasticsearch 的欢迎页面。

欢迎页面

二、本地 Python 连接 Elasticsearch

在确保服务器端配置无误后，接下来我们在本地使用 Python 连接到 Elasticsearch。首先，你需要安装 elasticsearch Python 客户端库：

pip install elasticsearch

1. 连接 Elasticsearch

以下是连接到 Elasticsearch 的示例代码：

from elasticsearch import Elasticsearch

# 连接到 Elasticsearch，替换为实际的 IP 地址和密码
es = Elasticsearch('http://192.168.111.199:9200', basic_auth=('elastic', 'Elastic_j625sz'))

# 检查连接
if es.ping():
    print('连接成功')
else:
    print('连接失败')

在上述代码中，basic_auth 参数用于传递用户名和密码。如果你的 Elasticsearch 没有设置密码，可以省略该参数。

2. 索引操作

# 创建索引  
es.indices.create(index="my_index")  

# 删除索引  
es.indices.delete(index="my_index")  

# 检查索引是否存在  
es.indices.exists(index="my_index")

索引操作

3. 文档操作

连接成功后，我们可以开始进行数据存储和搜索操作。以下是一个创建索引并插入数据的示例：

    # 添加文档
    doc1 = {
        "title": "测试文档1",
        "content": "这是一个测试文档1",
        "timestamp": "2024-12-07"
    }
    doc2 = {
        "title": "测试文档2",
        "content": "这是一个测试文档2",
        "timestamp": "2024-12-01"
    }
    # 指定ID插入
    es.index(index="my_index", id="1", document=doc1)
    # 自动生成ID插入
    es.index(index="my_index", document=doc2)

    # 获取文档
    result = es.get(index="my_index", id="1")
    print(result)

    # 更新文档
    update_doc = {
        "doc": {
            "title": "更新后的标题"
        }
    }
    es.update(index="my_index", id="1", body=update_doc)
    print(es.get(index="my_index", id="1"))

    # 删除文档
    es.delete(index="my_index", id="1")

文档操作

4. 搜索内容

接下来，我们可以通过搜索来查找我们存储的数据。

在这之前，定义一个打印文档的方法：

def print_doc(result):
    for hit in result['hits']['hits']:
        print(f"文档ID: {hit['_id']}")
        print(f"得分: {hit['_score']}")
        print(f"文档内容: {json.dumps(hit['_source'], indent=2, ensure_ascii=False)}")
        print("-" * 50)

下面是常用的搜索方式：

    # 简单搜索
    query = {
        "query": {
            "match": {
                "title": "测试"
            }
        }
    }
    result = es.search(index="my_index", body=query)
    print_doc(result)

    # 复杂搜索（bool查询）
    query = {
        "query": {
            "bool": {
                "must": [
                    {"match": {"title": "测试"}},
                    {"range": {"timestamp": {"gte": "2024-01-01"}}}
                ]
            }
        }
    }
    result = es.search(index="my_index", body=query)
    print_doc(result)

    # 分页查询
    query = {
        "query": {"match_all": {}},
        "from": 0,  # 从第几条开始
        "size": 10  # 返回多少条
    }
    result = es.search(index="my_index", body=query)
    print_doc(result)

在这个示例中，我们搜索了包含“测试”这个词的文档，并打印出搜索结果。

搜索内容

5. 聚合查询

# 聚合查询示例  
query = {  
    "aggs": {  
        "popular_titles": {  
            "terms": {  
                "field": "title.keyword",  
                "size": 10  
            }  
        }  
    }  
}  
result = es.search(index="my_index", body=query)

聚合查询

6. 批量操作

# 批量插入  
actions = [  
    {"_index": "my_index", "_source": {"title": "文档1"}},  
    {"_index": "my_index", "_source": {"title": "文档2"}},  
]  
from elasticsearch.helpers import bulk  
bulk(es, actions)

批量操作

三、注意事项

在使用 Elasticsearch 时，有几个注意事项需要牢记：

确保 Elasticsearch 服务正在运行：在进行任何操作之前，确保 Elasticsearch 服务已经启动。
检查网络连接：确保本地机器与服务器之间的网络连接畅通。
认证信息：如果 Elasticsearch 配置了认证，连接时必须提供正确的用户名和密码。
安全措施：在生产环境中，建议配置合适的安全措施，例如使用 HTTPS 和防火墙规则。
记得在完成操作后关闭连接：es.close()

四、故障排除

如果在连接或操作 Elasticsearch 时遇到问题，可以尝试以下方法进行排查：

使用 telnet 测试端口连通性：

telnet <你的服务器IP> 9200

检查 Elasticsearch 的日志文件，查看是否有错误信息。
确认 elasticsearch.yml 配置文件中的设置是否正确，并重启 Elasticsearch 服务以应用更改。

结论

通过以上步骤，你应该能够成功使用 Python 连接到 Elasticsearch，并进行基本的文档存储和搜索操作。Elasticsearch 提供了强大的搜索能力，结合 Python 的灵活性，可以帮助你构建高效的数据检索系统。希望这篇文章能帮助你更好地理解如何使用 Python 操作 Elasticsearch。

以上就是Python连接和操作Elasticsearch的详细指南的详细内容，更多关于Python连接和操作Elasticsearch的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python PyQt4实现QQ抽屉效果
这篇文章主要为大家详细介绍了Python PyQt4实现QQ抽屉效果，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-04-04
python执行js代码的方法
现在为了防止反爬，前端使用的反爬技术比较多的是js代码混淆。python作为爬虫界的扛把子，免不了和js打交道，因此我们需要了解如何使用Python执行js代码
2021-05-05
基于Python第三方插件实现西游记章节标注汉语拼音的方法
这篇文章主要介绍了基于Python第三方插件实现西游记章节标注汉语拼音的方法,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-05-05
Python实战之IQ测试系统的实现
通常，智商测试测验一个人在数字、空间、逻辑、词汇、创造、记忆等方面的能力。本文将利用Python实现一个IQ测试系统，感兴趣的可以了解一下
2022-09-09
Python关于print的操作(倒计时、转圈显示、进度条)
这篇文章主要介绍了Python关于print的操作(倒计时、转圈显示、进度条)，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-05-05
自动转换Python代码为HTML界面的GUI库remi使用探究
这篇文章主要为大家介绍了自动转换Python代码为HTML界面的GUI库remi使用探究,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2024-01-01
python连接sql server乱码的解决方法
为解决python连接sql server是出现的乱码，需要在连接sql server 时指定字符集utf8(client charset = UTF-8)，python环境制定了字符集变量(#coding=utf-8 )
2013-01-01
python基于selenium爬取斗鱼弹幕
这篇文章主要介绍了python如何基于selenium爬取斗鱼弹幕，帮助大家更好的理解和学习使用python，感兴趣的朋友可以了解下
2021-02-02
Python使用QQ邮箱发送邮件实例与QQ邮箱设置详解
这篇文章主要介绍了Python发送QQ邮件实例与QQ邮箱设置详解,需要的朋友可以参考下
2020-02-02
编写Python脚本批量下载DesktopNexus壁纸的教程
这篇文章主要介绍了编写Python脚本批量下载DesktopNexus壁纸的教程,相较于普通的爬虫抓取,本文的下载壁纸教程还包括了设置所要下载的分辨率等功能的实现,需要的朋友可以参考下
2015-05-05