天天看點

Confluence 6 附件是如何被索引的

當一個檔案被上傳到 Confluence 後,Confluence 将會嘗試對檔案進行解壓,然後對檔案中的内容進行索引。這樣系統就能夠允許使用者對檔案中的内容進行搜尋,而不僅僅是搜尋檔案名。這個過程對系統的記憶體要求比較高,如果你上傳的附件比較大的時候還會導緻記憶體溢出。Confluence 有下面的一些配置被用來避免出現記憶體溢出的錯誤:

  • 如果你上傳的檔案大小大于 100 MB,Confluence 将不會嘗試對檔案進行解壓和内容進行索引。你隻能在 Confluence 中對檔案名進行查找。
  • 如果你上傳的檔案為下面的一些檔案類型,Confluence 僅僅對不超過大小的檔案類型進行解壓:
    • 1 MB Excel 的文本(.xlsx)
    • 8 MB PDF 的文本(.pdf)
    • 10 MB Text 檔案的文本(包括 .txt, .xml, .html, .rtf 等)
    • 16 MB Word  的文本(.docx)
  • 當從上面的檔案類型中解壓出來的檔案超過 1MB,那這個内容就是可以在系統中進行查找,但是 Confluence 将不會在快速查找中顯示結果。

如果 Confluence 停止解壓文本,那麼這個文本檔案中隻有部分内容可以進行查找。

Confluence 隻會對檔案進行解壓和索引一次,如果在這個過程中失敗了,Confluence 不會再出嘗試進行解壓和索引。

一些變量是可以通過

system properties

的參數進行配置的。如果你在附近進行索引的過程中遇到記憶體錯誤,你可能希望對系統進行調整,調整可以使用的參數如下:

  • atlassian.indexing.attachment.maxsize

  • officeconnector.excel.extractor.maxlength

  • officeconnector.textextract.word.docxmaxsize
  • atlassian.indexing.contentbody.maxsize

https://www.cwiki.us/display/CONF6ZH/Configuring+Attachment+Size