База знаний (Knowledge Base)
Источник: doc.nextbot.ru/functional/baza-znanii
Что такое база знаний
База знаний (Источники знаний) — это набор информационных источников, которые дают ИИ-Агенту доступ к данным вашей компании. Агент использует эти знания для ответов на вопросы, которые выходят за рамки его основных инструкций.
Типы источников
| Тип | Описание | Когда использовать |
|---|---|---|
| База знаний | Ручное добавление вопросов-ответов или текстовых блоков | Небольшие наборы данных, FAQ |
| Документы | Загрузка файлов (PDF, DOCX, TXT) | Инструкции, каталоги, прайс-листы |
| OpenAI Documents | Обработка документов через OpenAI | Большие документы, глубокий поиск |
| OpenAI Web Search | Поиск информации в интернете | Актуальные данные, новости |
| Таблицы | Структурированные данные (CSV/JSON) | Каталоги товаров, прайс-листы, справочники |
| Справочники | Статичные справочные данные | Фиксированные списки значений |
База знаний (ручные записи)
Форматы записей
- Вопрос-ответ — агент видит пару Q&A
- Текстовый блок — произвольный текст с информацией
- Категоризация — группировка по темам
Рекомендации
- Одна запись = одна тема или один вопрос
- Формулируйте записи так, как спросит клиент
- Используйте синонимы для лучшего поиска
- Обновляйте базу при изменении информации
Документы
Поддерживаемые форматы
- DOCX
- TXT
- Другие текстовые форматы
Обработка
- Документы разбиваются на чанки (фрагменты)
- Релевантные чанки подставляются в контекст запроса
- Размер чанков влияет на точность поиска
Таблицы
Преимущества таблиц
| Преимущество | Описание |
|---|---|
| Большие объёмы | Обработка тысяч строк данных |
| Экономия токенов | Подставляются только нужные строки (в отличие от Base знаний, где весь текст) |
| Без интеграций | Не нужна внешняя база данных |
| Структурированность | Колонки для точного поиска и фильтрации |
Создание таблицы
Вручную
- Перейти в Источники знаний → Таблицы
- Нажать «Создать таблицу»
- Определить колонки (название, тип)
- Заполнить строки
Из файла
- Подготовить файл CSV или JSON
- Загрузить в интерфейсе
- Настроить соответствие колонок
Поиск по таблицам
Для использования таблиц агентом нужно создать функцию с действием поиска по таблице:
Функция: search_products
Описание: "Поиск товара по названию или артикулу"
Параметры:
- query (text): "Что ищет клиент"
Действие: Поиск в таблице "Каталог товаров"
Пример структуры таблицы
| Название | Артикул | Цена | Валюта | Описание |
|---|---|---|---|---|
| Перевод USD→CNY | TR-001 | 2.5% | USD/CNY | Перевод из доллара в юань |
| SWIFT-перевод | SW-001 | $50 | USD | SWIFT-перевод в Китай |
| Оплата поставщику | PY-001 | 3% | CNY | Прямая оплата поставщику |
OpenAI Web Search
Позволяет агенту искать актуальную информацию в интернете:
- Новости и обновления
- Текущие курсы и цены
- Информация, которую нет в базе знаний
⚠️ Использование Web Search стоит дополнительные Botcoins
Рекомендации по организации знаний
- FAQ → База знаний (ручные записи)
- Каталоги, прайсы → Таблицы
- Инструкции, регламенты → Документы
- Актуальные данные → OpenAI Web Search
- Большие документы → OpenAI Documents
Советы по оптимизации (бизнес-практика)
На основе видео-уроков и опыта внедрений:
- Размер имеет значение: Разбивайте длинные инструкции (более 10 страниц) на несколько файлов по темам. Это повышает точность поиска (RAG).
- Разметка Markdown: Используйте заголовки (#, ##) и списки внутри текстовых файлов. Агент лучше понимает структуру документа.
- Чистота данных: Удаляйте из документов лишнюю информацию (колонтитулы, номера страниц, юридические сноски), если они не несут ценности для ответа.
- Таблицы vs Текст: Если данные можно представить в виде таблицы — делайте таблицу. Поиск по строкам в таблицах в NextBot работает точнее и дешевле, чем поиск по тексту.
- Синонимы в Q&A: Если пользователи называют услугу по-разному (например, «ВЭД» и «перевод поставщику»), добавьте оба варианта в вопрос или ключевые слова записи.
- Актуализация: Раз в месяц проверяйте «Темы без ответа» в аналитике, чтобы дополнять базу знаний новыми данными.