Langchain之大模型Cache緩存

作者：大狗在海裡 2023-06-13 07:09:00

模型即服務，尤其高并發低延遲場景下不能每次都調用LLM。響應時間長占用資源多，最後肯定需要LLM-Cache。Langchain也支援內建Cache，而且品類非常多。

1.InMemoryCache

記憶體性質,大資料緩存記憶體資源比較高

最簡單的memory：就是”硬“緩存更新删除

2.RedisCache

redis的memory：對prompt+llmstring做hash-md5

3.RedisSemanticCache

Redis的STS插件例如RedisSemantic語義檢索

4.SQLAlchemyCache

利用資料庫做Cache，SQLAlchemy支援的資料庫都可以考慮

5.SQLiteCache

測試實驗性質科研，你懂的

6.GPTCache

完整級别解決方案（涵蓋Embedding Model,Cache Storage,Vector Store,Cache Manager[LRU,LFU,FIFO],Similarity Evaluator等），就是那個向量資料庫Milvus營運商Zilliz推出解決方案

簡單使用樣例：

初始化實作

簡單舉例：

#cache選擇mysql

cache_base = CacheBase('mysql',sql_url='mysql+pymysql://root:[email protected]:3306/mysql')

#使用milvus作為vectordb

vector_base = VectorBase('milvus', host='127.0.0.1', port='19530', dimension=hf.dimension)

#data管理器

data_manager = get_data_manager(cache_base, vector_base)

cache.init(

pre_embedding_func=None,#沒有自定義函數可以為空

embedding_func=hf.to_embeddings,

data_manager=data_manager,

similarity_evaluation=SearchDistanceEvaluation(), ##相似性算法評估

)

7.MomentoCache:三方服務key收費，要錢的始終不能幹[捂臉]

介紹這麼多Cache，最後考慮成本開源安全高效可靠：建議還是采用Redis/RedisSemantic或者VectorDB做緩存，然後相似性比對檢索。也可以考慮GPTCache複雜度高且對竟對vectordb産品支援度有限主推自己産品[笑哭]。上述Cache方式繼承BaseCache實作lookup，update,clear抽象方法。

Langchain之大模型Cache緩存

繼續閱讀

基于OPL棧的LLM應用開發【OpenAI/Pinecone/Langchain】

REST Assured 7 - 鍊式調用方法

兩次hbase丢失資料的故障及原因分析

langchain-ChatGLM 打造自己的GPT和知識庫

現在已經到了6月了，這幾天KVC還是會一如既往的給沒有收到的先峰發送，收到了沒有通過的也會陸續通過，管裡剛在聊天室表示：

【TB清倉45折，不退不換】Willapatchworkchainwallet格紋拼接牛皮鍊條錢包折後💰¥2599直郵

Langchain實作Tool工具的主要方式

Langchain大模型開源開發架構：搭建智能的AI系統！

使用 Langchain、Pinecone、LLM 和 Streamlit 建構互動式聊天機器人

【Python入門】28.常用内置子產品之操作疊代對象itertools常用内置子產品itertools

大語言模型的開發利器langchain

Restaurant chain Tsui Wah sells assets to survive

什麼是供應鍊(Supply chain)?

在langchain中使用帶簡短知識内容的prompt template

大模型應用開發進入新階段，微軟、langchain有了新動作

00後華人大模型創業,組隊7人挑戰langchain,矽谷頂創給了天使投資