hiho #1014 : Trie樹（字典樹的建立和查找）

#1014 : Trie樹

描述

小Hi和小Ho是一對好朋友，出生在資訊化社會的他們對程式設計産生了莫大的興趣，他們約定好互相幫助，在程式設計的學習道路上一同前進。

這一天，他們遇到了一本詞典，于是小Hi就向小Ho提出了那個經典的問題：“小Ho，你能不能對于每一個我給出的字元串，都在這個詞典裡面找到以這個字元串開頭的所有單詞呢？”

身經百戰的小Ho答道：“怎麼會不能呢！你每給我一個字元串，我就依次周遊詞典裡的所有單詞，檢查你給我的字元串是不是這個單詞的字首不就是了？”

小Hi笑道：“你啊，還是太年輕了！~假設這本詞典裡有10萬個單詞，我詢問你一萬次，你得要算到哪年哪月去？”

小Ho低頭算了一算，看着那一堆堆的0，頓時感覺自己這輩子都要花在上面了...

小Hi看着小Ho的囧樣，也是繼續笑道：“讓我來提高一下你的知識水準吧~你知道樹這樣一種資料結構麼？”

小Ho想了想，說道：“知道~它是一種基礎的資料結構，就像這裡說的一樣！”

小Hi滿意的點了點頭，說道：“那你知道我怎麼樣用一棵樹來表示整個詞典麼？”

小Ho搖搖頭表示自己不清楚。

提示一：Trie樹的建立

“你看，我們現在得到了這樣一棵樹，那麼你看，如果我給你一個字元串ap，你要怎麼找到所有以ap開頭的單詞呢？”小Hi又開始考校小Ho。

“唔...一個個周遊所有的單詞？”小Ho還是不忘自己最開始提出來的算法。

“笨！這棵樹難道就白建構了！”小Hi教訓完小Ho，繼續道：“看好了！”

提示二：如何使用Trie樹

提示三：在建立Trie樹時同時進行統計！

“那麼現在！趕緊去用代碼實作吧！”小Hi如是說道

輸入

輸入的第一行為一個正整數n，表示詞典的大小，其後n行，每一行一個單詞（不保證是英文單詞，也有可能是火星文單詞哦），單詞由不超過10個的小寫英文字母組成，可能存在相同的單詞，此時應将其視作不同的單詞。接下來的一行為一個正整數m，表示小Hi詢問的次數，其後m行，每一行一個字元串，該字元串由不超過10個的小寫英文字母組成，表示小Hi的一個詢問。

在20%的資料中n, m<=10，詞典的字母表大小<=2.

在60%的資料中n, m<=1000，詞典的字母表大小<=5.

在100%的資料中n, m<=100000，詞典的字母表大小<=26.

本題按通過的資料量排名哦～

輸出

對于小Hi的每一個詢問，輸出一個整數Ans,表示詞典中以小Hi給出的字元串為字首的單詞的個數。

樣例輸入

5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab

樣例輸出

Emacs

Normal

Vim

知識拓展

提示一：Trie樹的建立

小Hi于是在紙上畫了一會，遞給小Ho，道：“你看這棵樹和這個詞典有什麼關系？”

對于從樹的根節點走到每一個黑色節點所經過的路徑，如果将路徑上的字母都連起來的話，就都對應着詞典中的一個單詞呢！”

小Hi說道：“那你知道如何根據一個詞典建構這樣一棵樹麼？”

“不造！”

“想你也不知道，我來告訴你吧~”小Hi擺出一副老師的樣子，說道：“你先這麼想，如果我已經有了這樣的一個詞典和對應的一棵樹，我要添加一個新的單詞apart，我應該怎麼做？”

“讓我想想……”小Ho又開始苦思冥想：“首先我要先看看已經能走到哪一步了對吧？比如我從1号節點走"a"這一條邊就可以走到2号節點，然後從2号節點走"p"這一條邊可以走到3号節點，然後……就沒路可走了！這時候我就需要添加一條從3号節點出發且标記為"p"的邊才可以接着往下走……最後就是這樣了！然後我把最後到達的這個結點标記為黑色就可以了。”

小Hi說道：“真聰明~那你不妨再算算如果是一個有10W個單詞的詞典，每個單詞的長度不超過10的話，這棵樹會有多大？”

小Ho于是掏出筆來，一邊畫一遍念叨：“假設我已經将前三個單詞構成了這樣一棵樹，那麼我要添加一個新的單詞的時候，最壞情況是這個單詞和之前的三個單詞都沒有公共字首，那麼這個新的單詞的長度如果是5的話，我就至少要添加5個結點到樹中才能夠繼續表示這個詞典！”

“而如果每次都是最壞情況的話，這棵樹最多也就100W個結點這麼大！更何況最壞情況是不可能次次都發生的！畢竟字母表也才26個字母呢！”小Ho繼續說道。

“嗯~這樣我們是不是就可以用（單詞個數*單詞長度）個結點來表示一個詞典了呢？小Hi問道。

“是的呢！”小Ho道：“但是這樣一棵樹又有什麼用呢？”

“可别小看了它，它就是傳說中的Trie樹哦~至于他有什麼用，一會你就知道了！”小Hi笑嘻嘻的回答道。

提示二：如何使用Trie樹

“這個結點……是從根節點先走"a"然後走"p"到達的結點呢！哦~~我知道了，以這個結點為根的子樹裡所有标記結點都是以"ap"為字首的單詞呢！而且所有以"ap"為字首的單詞都在以這個節點為根的子樹裡~”小Ho驚喜道。

“是的呢~那你對怎麼解決我的問題有想法了麼？”小Hi追問道。

“唔...那就是每次拿到你的字元串之後，我在樹上找到其對應的那個結點，然後統計這個節點中有多少個标記節點？”小Ho不是很确定的答道：“但是這樣...似乎在最壞情況，也就是你每次給個字元串都很短的時候，我還是要掃描這棵樹的很大一部分呢？也就是說雖然平均時間複雜度降低了，但是最壞情況時間複雜度還是很高的樣子！”

小Hi笑嘻嘻道：”沒想到你自己看出來了呢~我還以為又要教訓你了！~那你有什麼好的解決方法麼？”

“沒呢！小Hi你就别賣關子了，趕緊告訴我吧！”被折磨的夠嗆的小Ho開始求饒。

“好吧！就幫你這一回~”

提示三：在建立Trie樹時同時進行統計！

Trie樹，又稱字典樹或者字首樹，單詞查找樹，是一種樹形結構。每個節點在書中的位置決定了它代表的字元串。

Trie可以看成是确定有限狀态自動機的一種特例它接受所有字典中出現的單詞。根節點是起始态，所有粗線的節點都是接受态。

算法：

在Trie中插入查找删除一個字元串的操作相似。加入要插入的字元串為S，長度為m 我們以插入為例

(1)從根節點開始從前向後依次讀入S的每個字元c

(2)如果目前節點沒有一條指向孩子的邊為c 那麼建立這樣一條邊和一個孩子節點

(3)沿着c這條邊走到下一層的節點

(4)如果還有下一個字元回到(1) 否則标記目前節點結束。

Trie 就好像維護了一個字典可以再這個字典裡插入删除字元串，也可以查詢一個字元串是否在字典中 Tir的插入查找删除複雜度都是O(m)的其中m為待插入串的長度

用途：

1.Trie可以用來給字元串排序把這些字元串都插入Trie之後先序周遊即可

2.Trie的節點上可以存貯額外的資訊比如做詞頻統計隻需要每個節點上記錄一個整數每次插入時将節點的計數器+1（也就是這道題）

3.Trie上支援查找最長公共字首的字元串。

4.在一些應用中實作字元串的自動補全功能

AC代碼：

#include <stdio.h>
#include <iostream>
struct Trie
{
  int count;
  struct Trie *word[26];
  Trie()
  {
    count=0;
    for(int i=0;i<26;i++)
    word[i]=NULL;
  }
};
void insert(Trie *root,char str [])
{
  for(str;*str;str++)
  {
    if(root->word[*str-'a'])
    {
      root->word[*str-'a']->count++;
    }
    else
    {
      root->word[*str-'a'] =new Trie();
      root->word[*str-'a']->count++;
    }
    
    root=root->word[*str-'a'];
  //  printf("%c %d\t",*str,root->count);
  }
}
int search(Trie *root,char str [])
{
  int count;
  while(*str)
  {
    if(root->word[*str-'a'])
    root=root->word[*str-'a'],count=root->count;
    else
    {
      count=0;
      break;
    }
//    printf("--%d ",count);
    str++;
  }
  return count;
}
int main()
{
  int n,m;
  Trie *root=new Trie();
  scanf("%d",&n);
  while(n--)
  {
    char str[20];
    scanf("%s",str);
    insert(root,str);
  }  
  scanf("%d",&m);
  while(m--)
  {
    char str[20];
    scanf("%s",str);
    printf("%d\n",search(root,str));
  }
  return 0;
}

hiho #1014 : Trie樹（字典樹的建立和查找）

#1014 : Trie樹

描述

輸入

輸出

繼續閱讀

Trie字元串統計數組實作

leetcode3:longest-substring-without-repeating-characters

Mysql入門之簡單的DQL查詢語句【Mysql資料庫基礎】

【leetcode】32.longest-valid-parentheses（最長有效括号）【leetcode】32.longest-valid-parentheses（最長有效括号）

力扣每日一題：65. 有效數字題目：65. 有效數字解題思路

HDU 3608 最長回文

UVALive 5913 (LA 5913) Dictionary Size Trie樹計數

HDU 5685 Problem A

sqli-labs第一關--報錯注入練習

python之判斷字元裡面有沒有|8

淺談MFC CSting類拼接效率

C和java中關于字元串與字元數組的定義和轉化

Java：String類字元串與數組之間的轉換

Java中 byte[] 數組與 String 字元串的轉化

回文樹學習小結

查找檔案中的字元串

hiho #1014 : Trie樹 （字典樹的建立和查找）

#1014 : Trie樹

描述

輸入

輸出

繼續閱讀

hiho #1014 : Trie樹（字典樹的建立和查找）