C
ChaoBro

Векторный поиск под угрозой: PageIndex заменяет эмбеддинги рассуждениями, 30k звёзд

Векторный поиск под угрозой: PageIndex заменяет эмбеддинги рассуждениями, 30k звёзд

Векторные базы данных — самая переполненная ниша в AI-инфраструктуре. Chroma, Milvus, Pinecone, Weaviate — каждый рассказывает историю эмбеддингов. Затем появился PageIndex и сказал: хватит хранить векторы, мы будем использовать рассуждения.

Это не «улучшение» embedding-моделей. Это переосмысление с нуля.

Что делает

PageIndex превращает retrieval в процесс рассуждения. Вместо преобразования документов в векторы фиксированной размерности, он строит индексную структуру, способную к логическому выводу — модель принимает логические решения при поиске, а не математические аппроксимации.

31,279 звёзд на GitHub, 2,805 за одну неделю. 2,665 форков — люди не просто смотрят, а используют.

Моя оценка

PageIndex не заменяет векторные базы данных — по крайней мере, пока. Его retrieval на основе рассуждений имеет преимущества в точности, но стоимость и скорость остаются серьёзными ограничениями.

Сценарии, где это работает:

  • Профессиональные области, требующие высокоточного поиска (юридическая, медицинская, финансовая сферы)
  • Большой объём документов при низкой частоте запросов
  • Когда качество поиска важнее задержки

Векторный поиск доминировал в RAG годами. PageIndex бросает вызов предположению «семантическое сходство = релевантность информации». Выдержит ли вызов — покажут данные. Но одно доказано: дорога RAG ещё не закончена.


Основные источники: