Python将json文件写入ES数据库的方法

 更新时间:2019年04月10日 10:00:54   作者:poziiey  
这篇文章主要介绍了Python将json文件写入ES数据库的方法,本文给大家介绍的非常详细,具有一定的参考借鉴价值 ,需要的朋友可以参考下

1、安装Elasticsearch数据库

PS:在此之前需首先安装Java SE环境

下载elasticsearch-6.5.2版本,进入/elasticsearch-6.5.2/bin目录,双击执行elasticsearch.bat 打开浏览器输入http://localhost:9200 显示以下内容则说明安装成功

安装head插件,便于查看管理(还可以用kibana)

首先安装Nodejs(下载地址https://nodejs.org/en/

再下载elasticsearch-head-master包解压到/elasticsearch-6.5.2/下(链接: https://pan.baidu.com/s/1q3kokFhpuJ2Q3otPgu7ldg

提取码: 1rpp

修改配置文件elasticsearch-6.5.2\config\elasticsearch.yml如下:

进入elasticsearch-head-master目录下执行npm install -g grunt-cli,再执行npm install安装依赖

elasticsearch-head-master目录下找到Gruntfile.js文件修改服务器监听地址如下:

执行grunt server命令启动head服务

访问地址 http://localhost:9100/ 即可访问head管理页面

2、将json文件写入ES数据库(py脚本如下)

# -*- coding: UTF-8 -*-
from itertools import islice
import json , sys
from elasticsearch import Elasticsearch , helpers
import threading
_index = 'indextest' #修改为索引名
_type = 'string'  #修改为类型名
es_url = 'http://192.168.116.1:9200/' #修改为elasticsearch服务器
reload(sys)
sys.setdefaultencoding('utf-8')
es = Elasticsearch(es_url)
es.indices.create(index=_index, ignore=400)
chunk_len = 10
num = 0
def bulk_es(chunk_data):
 bulks=[]
 try:
  for i in xrange(chunk_len):
   bulks.append({
     "_index": _index,
     "_type": _type,
     "_source": chunk_data[i]
    })
  helpers.bulk(es, bulks)
 except:
  pass
with open(sys.argv[1]) as f:
 while True:
  lines = list(islice(f, chunk_len))
  num =num +chunk_len
  sys.stdout.write('\r' + 'num:'+'%d' % num)
  sys.stdout.flush()
  bulk_es(lines)
  if not lines:
   print "\n"
   print "task has finished"
   break

总结

以上所述是小编给大家介绍的Python将json文件写入ES数据库的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Python多线程与多处理之间的区别详解

    Python多线程与多处理之间的区别详解

    在本文中,我们将学习 Python 中多线程和多处理的内容、原因和方式,文中通过代码示例给大家介绍的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下
    2024-01-01
  • Pygame游戏开发之太空射击实战碰撞改进篇

    Pygame游戏开发之太空射击实战碰撞改进篇

    相信大多数8090后都玩过太空射击游戏,在过去游戏不多的年代太空射击自然属于经典好玩的一款了,今天我们来自己动手实现它,在编写学习中回顾过往展望未来,在本课中,我们将讨论如何更改 Pygame 处理精灵之间冲突的方式
    2022-08-08
  • 从零开始搭建基于Python的微信小程序的教程分享

    从零开始搭建基于Python的微信小程序的教程分享

    这篇文章主要为大家展示了如何从零开始搭建一个基于 Python 的微信小程序项目,包含详细的解决思路、方案和实际案例,希望对大家有所帮助
    2023-05-05
  • 使用pygame模块编写贪吃蛇的实例讲解

    使用pygame模块编写贪吃蛇的实例讲解

    下面小编就为大家分享一篇使用pygame模块编写贪吃蛇的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-02-02
  • Django 前后台的数据传递的方法

    Django 前后台的数据传递的方法

    本篇文章主要介绍了Django 前后台的数据传递的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • python memory_profiler库生成器和迭代器内存占用的时间分析

    python memory_profiler库生成器和迭代器内存占用的时间分析

    这篇文章主要介绍了python memory_profiler库生成器和迭代器内存占用的时间分析,文章围绕主题展开详细的内容介绍,感兴趣的小伙伴可以参考一下
    2022-06-06
  • 详解Python中的Descriptor描述符类

    详解Python中的Descriptor描述符类

    这里我们将来详解Python中的Descriptor描述符类,包括定义描述符并展示如何调用描述符,需要的朋友可以参考下
    2016-06-06
  • Python3基于sax解析xml操作示例

    Python3基于sax解析xml操作示例

    这篇文章主要介绍了Python3基于sax解析xml操作,结合实例形式分析了Python3使用sax解析xml文档的相关原理与实现技巧,需要的朋友可以参考下
    2018-05-05
  • Python字典底层实现原理详解

    Python字典底层实现原理详解

    今天小编就为大家分享一篇Python字典底层实现原理详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • 解决pytorch读取自制数据集出现过的问题

    解决pytorch读取自制数据集出现过的问题

    这篇文章主要介绍了解决pytorch读取自制数据集出现过的问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05

最新评论