RAG-движок и База знаний: Глубокая настройка
1. Типы данных и Умный поиск (Semantic Search)
NextBot использует векторизацию (embeddings) для поиска по смыслу. Ключевой тип поля — text_vector.
Поиск в таблицах:
- text_vector (Умный поиск): Обязательно использовать оператор «По схожести».
- Порог схожести: Настройка чувствительности. Чем выше порог, тем точнее (но меньше) результатов.
- Поля для поиска: Рекомендуется использовать 1-2 смысловых поля. Использование более 5 полей снижает точность.
- Максимальное количество результатов: Рекомендуемое значение — 5. Увеличение ведет к повышенному расходу токенов модели.
2. Квалификация параметров (Function Calling + RAG)
Для эффективного поиска по базе данных через функции (например, get_product_info):
- Необязательный параметр: Если пометить поле как необязательное в функции, бот сможет искать только по части данных.
- Пример: Клиент спросил «Есть ли трактор?», не указав цену. Бот проигнорирует поле
priceи найдет все записи поis_available.
- Пример: Клиент спросил «Есть ли трактор?», не указав цену. Бот проигнорирует поле
- Листовые значения (Possible Values): Маппинг естественного языка на технические значения.
- Пример: "Да", "конечно", "имеется" ->
true. "Нет", "отсутствует" ->false.
- Пример: "Да", "конечно", "имеется" ->
3. Источники знаний
- Текстовые документы: PDF, Docx. Индексируются целиком.
- Таблицы (CSV/Интерфейс): Позволяют боту выполнять структурированные запросы.
- Справочники: Быстрые сопоставления (ключ-значение).
- Web Search: Использование Open Search для поиска актуальной информации в интернете (требует настройки).
4. Оптимизация токенов в KB
- Выбор возвращаемых полей: В настройках функции поиска выбирайте только те поля, которые действительно нужны клиенту (например,
описаниеицена), исключая технические ID. Это существенно экономит бюджет BotCoin.