Skip to main content

向量資料庫Pinecone推出AI代理知識引擎Nexus,主打以預先編譯知識改善RAG檢索問題

Posted in 業界新聞
新聞

Pinecone表示,目前代理式AI約有85%的運算工作與知識檢索相關,但任務完成率仍僅約50%至60%。不只增加Token成本,也容易因反覆檢索與上下文不足而產生幻覺(hallucination)或遺漏重要資訊。

該公司認為,現行RAG流程本質上仍是將大量原始文件片段交由模型即時處理,因此推論延遲、成本與輸出結果的穩定性都會受到影響。Nexus則試圖將部分知識整理工作提前至資料處理階段完成。

根據Pinecone說明,Nexus主要由Context Compiler與Composable Retriever兩大元件構成。Context Compiler可先根據企業資料與代理任務需求,建立適合特定工作流程的結構化知識內容;Composable Retriever則負責依不同代理需求,以適當格式提供相關知識資料。

Pinecone舉例,中型SaaS企業的資料通常分散於資料倉儲、Slack、Salesforce等不同系統。現行AI代理工具多半直接掃描所有資料來源,再自行整理上下文,不只容易產生錯誤,也可能被大量無關資訊干擾。Nexus則改以預先建構特定任務所需的知識內容,讓代理直接存取經過整理的知識成果,而非反覆查詢原始文件。

Pinecone也同步公布KnowQL查詢語言,讓AI代理可透過統一格式描述查詢意圖、資料來源、輸出格式、可信度與延遲需求等條件,以取得結構化且附帶引用來源的回應內容。

《The New Stack》分析指出,Pinecone過去是推廣RAG架構與向量資料庫的重要業者之一,如今卻主張傳統RAG模式開始面臨代理式AI工作負載帶來的效能挑戰,也反映AI基礎架構正從單純向量搜尋,轉向更重視上下文工程(context engineering)與知識預先整理的新方向。

https://thenewstack.io/pinecone-nexus-rag-obsolete/ thenewstack.io
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.