go语言数据结构之前缀树Trie

 更新时间:2022年05月17日 10:35:03   作者:​ 呆呆灿   ​  
这篇文章主要介绍了go语言数据结构之前缀树Trie,文章围绕主题展开详细内容介绍,具有一定得参考价值,需要的小伙伴可以参考一下

介绍

Trie树:又称为单词查找树,是一种树形结构,可以应用于统计字符串,会在搜索引擎系统中用于对文本的词频统计,下图是一个Trie树的结构,同时它也是在插入数时的一个顺序图.

流程

  • 首先应该先创建一个结构体,里面保存的是每一个节点的信息
  • 初始化根节点,根节点应该初始化啥?啥也不用初始化,给个空就好看上图
  • 插入:串转字符数组;遍历数组,如果下一个节点为空,创建,则继续遍历
  • 查找:串转字符数组,遍历如何所有字符都在树里面存在,并则最后一个字符Node中的end不为零,就视为存在
  • 删除: 字符串转数组,遍历数组,在树上找到对应的字符,path-1

代码

type Node struct {
	path     int
	end      int
	children [26]*Node
}

在这个结构体里面有一个path,它的作用是啥呢?当有经过此字符的时候这个path就加一

end又是干啥的呢?当一个单词的词尾是这个字符的时候end这个值就加一,就代表着这个字符做为一个单词的结尾

children是保存的啥呢?这个里面当然是保存的子节点啦,不用多说了叭~~~

初始化

func main() {
	list := &Node{path: 0, end: 0}
}

初始化根节点,上面说过根节点里面是不用保存数据的,这个我就把里面的参数初始化成0,当然也可以不用初始化里面的参数,children这里就没有创建出来,因为下面我就要开始插入的操作了

插入

/*
 * 插入数据
*/
func insertTrie(str string, root *Node) {
	if len(str) == 0 {
		return
	}
	tempNode := root
	for _, value := range str {
		if tempNode.children[value-'a'] == nil {
			tempNode.children[value-'a'] = &Node{path: 0, end: 0}
		}
		tempNode = tempNode.children[value-'a']
		tempNode.path++
	}
	tempNode.end++
}

在插入之前先说一点:在传入的参数中,str我传入前我将其转换成了小写的,当然也可以转换成大写或者是大小写都有的

插入之前先对字符串进行了一个判空的处理,如果为空就return了,在整个过程中,对字符串进行了遍历,像我在流程中那样说的将字符串转成字符数组,是应该这样操作,但是我发现在golang中可以直接对一个字符串进行了遍历,或许将语言换成了Java就需要将其转成字符数组了

for循环里面if判断时为什么数组的下标要用value-'a'这个东西来表示?可以想像一下,一个节点的children里面有26个子元素,比如这里的vlaue是b,那么就相当于是b-a,就是b的ASCII码减去a的ASCII码,这个就得到的是1

索引字符
0a
1b
2c

当当前的字符在数组里面没有对应的数据的时候创建一个就好,如果有的时候只要将当前数组的下标交给临时变量tempNode就好,所经过字符的path加1,将最后一个字符所对应的end加1,将其标记为一个此字符是一个单词的结尾即可.

查找

/*
 *查找数据
*/
func searchStr(str string,root *Node) bool {
	if len(str) == 0{
		return false
	}
	tempNode := root
	for _,value := range str{

		if tempNode.children[value - 'a'] == nil{
			return false
		}
		tempNode = tempNode.children[value - 'a']
	}
	if tempNode.end != 0{
		return true
	}
	return false
}

同样,在查找数据的时候也是将需要查找的字符串和前缀树的ROOT传入,字符串的判空处理也是必做的,这个里面的tempNode可以有也可以没有,我写tempNode可以是说是我的一个编码的习惯,同样,在查找单词的时候也是要遍历这个字符串(在插入的时候我就已经解释过了我这里为啥和流程中写的不一样,没有把字符串转成字符数组),在for循环里面第一个if如果第一个字符没有在前缀树中找到,那么就视为所要查找的字符串没有出现在这个前缀树里面,则将当前的字符节点交给临时变量tempNode,当整个循环遍历完成之后,也就说明我要查找的字符串中的每一个字符都在这颗前缀树里面并连续着.这个时候如果最后一个单词的end属性为大于0的一个数,那么这个要查找的字符串就一定在这颗前缀树里面,返回true

findstr

统计以XXX开头的单词个数

这个前缀树很强大,上面的解释也说到过,可以对文本的统计

strArgs:=[]string{"qQYgMU","FFpdCl","nyyJmh","XJCebb","OrCiHb","xvDdzZ","nyCebF","hi","hello","nyyJmn"}

在前缀树里面插入了这个数组里面的字符串,我现在要统计以n开头的单词有几个?如何处理呢?

这里就用到了在结构体中定义的Path属性了,在插入的时候说过当有一个字符经过这个path就会加1,所以我只需要找到所要查找前缀的最后一个单词拿到了它的path属性就可以知道以这个字符串开头的单词有几个

/*
 *查找以XX开头的数据有几个
*/
func searchPrefixCount(str string,root *Node) int{
	if len(str) == 0{
		return -1
	}
	tempNode := root
	for _,value := range str{
		if tempNode.children[value - 'a'] == nil {
			return 0
		}
		tempNode = tempNode.children[value - 'a']
		return tempNode.path
	}
	return -1
}

删除数据

删除数据的时候同样也是要遍历字符串,不过在此之前应该先查找一次这颗树里面有没有要删除的字符串,如果没有就直接return就好

/*
 * 删除数据
*/
func delStr(str string,root *Node) bool {
	if len(str) == 0{
		return false
	}
	if !searchStr(strings.ToLower(str),root) {
		return false
	}
	tempNode := root
	for _,value := range str{
		if tempNode.children[value - 'a'].path > 1 {
			tempNode.children[value - 'a'].path--
			tempNode = tempNode.children[value - 'a']
		}else{
			tempNode.children[value - 'a'] = nil
			return true
		}
	}
	return false
}

path是当有字符经过的时候加一,那么在删除数据的时候只要查找到字符将这个字符串所经过的字符的path减1, 我这里还加了一个else,当path等于1的时候也就是说明当前所要删除的字符串是最后一个经过此字符的字符串,这里直接将其置空,等系统回收就好了

到此这篇关于go语言数据结构之前缀树Trie的文章就介绍到这了,更多相关go 前缀树内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • golang如何利用原始套接字构造UDP包详解

    golang如何利用原始套接字构造UDP包详解

    这篇文章主要给大家介绍了关于golang如何利用原始套接字构造UDP包的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用golang具有一定的参考学习价值,需要的朋友们下面来一起看看吧。
    2017-10-10
  • go依赖注入库samber/do使用示例讲解

    go依赖注入库samber/do使用示例讲解

    这篇文章主要介绍了go依赖注入库samber/do使用,在本文中,我们学习了如何使用samber/do在 Go 中提供依赖注入,需要的朋友可以参考下
    2024-02-02
  • Go的gin参数校验中的validator库详解

    Go的gin参数校验中的validator库详解

    这篇文章主要介绍了Go的gin参数校验之validator库,使用 validator 以后,只需要在定义结构体时使用 binding 或 validate tag标识相关校验规则,就可以进行参数校验了,而不用自己单独去写常见的校验规则,需要的朋友可以参考下
    2023-08-08
  • Go语言中的Slice学习总结

    Go语言中的Slice学习总结

    这篇文章主要介绍了Go语言中的Slice学习总结,本文讲解了Slice的定义、Slice的长度和容量、Slice是引用类型、Slice引用传递发生“意外”等内容,需要的朋友可以参考下
    2014-11-11
  • go语言简单网络程序实例分析

    go语言简单网络程序实例分析

    这篇文章主要介绍了go语言简单网络程序实现方法,实例分析了服务器端与客户端的实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-02-02
  • 手把手带你走进Go语言之运算符解析

    手把手带你走进Go语言之运算符解析

    这篇文章主要介绍了手Go语言之运算符解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • Golang 中整数转字符串的方法

    Golang 中整数转字符串的方法

    这篇文章主要介绍了Golang 中整数转字符串的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06
  • Golang中的[]byte与16进制(String)之间的转换方式

    Golang中的[]byte与16进制(String)之间的转换方式

    这篇文章主要介绍了Golang中的[]byte与16进制(String)之间的转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-11-11
  • Go interface{} 转切片类型的实现方法

    Go interface{} 转切片类型的实现方法

    本文主要介绍了Go interface{} 转切片类型的实现方法,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-02-02
  • 一文详解go闭包(Closure)使用教程

    一文详解go闭包(Closure)使用教程

    在Go语言中,闭包(Closure)是一种特殊的函数,它可以捕获其创建时所在作用域中的变量,本文给大家详细介绍了go闭包(Closure)使用教程,感兴趣的朋友可以参考下
    2024-01-01

最新评论