l1 list

Вопрос-ответ

Вопрос-ответ или Первая линия или L1 — точные ответы без изменения формулировок в стиле FAQ либо перевод на оператора определённых вопросов (либо активация сценария - появится в ближайшее время), по которым ответы бота буду априори неэффективными.

Если срабатывает Первая линия, то пользователь получает заранее готовый ответ или автоматическое переключение на оператора.

Первая линия отлично подходит для тем, где нужно отвечать строго по регламенту.

Первую линию нужно использовать для переключения на оператора в чувствительных темах, например возвраты или удаление данных.

L1 значительно дешевле, чем ответ по базе знаний, и может быть использована как альтернатива базе знаний. Подробнее о ценах на L1.

Для добавления ответа нажмите Добавить в правом верхнем углу.

L1 состоит из Главного вопроса и Похожих вопросов. Для каждого вопроса задается один из двух вариантов: переключение на оператора или ответ, в зависимости от выбранного действия.

l1 new

Главный вопрос должен быть довольно узким, иначе он будет срабатывать очень часто.

Чтобы бот лучше понимал Главный вопрос необходимо задать его дополнительные формулировки — Похожие вопросы, но не больше 10 на 1 основной.

Похожие вопросы можно сгенерировать автоматически. После нажатия Сгенерировать приложение автоматически создаст до пяти похожих вопросов. Данная функция тратит 0.1 кредита за одно нажатие.

Тестировать Первую линию удобно на портале в разделе Тестирование. Вы сможете увидеть сработала или нет Первая линия и понять, почему.

Дополнительные рекомендации о настройке Первой линии.

База знаний

dataset

В этом разделе осуществляется работа с данными, по которым бот будет строить ответ.

Для добавления новых данных нажмите Добавить.

Добавление веб-сайта

Для добавления веб-сайта необходимо указать адрес сайта и выбрать парсер.

Парсер по умолчанию подходит для большинства веб-сайтов. Также доступны парсеры, подходящие под конкретные платформы, например Google Sheets или Notion.

Можно выбрать стратегию обхода веб-сайта:

  • Весь сайт - парсинг всех страниц с тем же доменом.
  • Одна страница - парсинг только этой страницы.
  • Папка - парсинг всех страниц, которые начинаются также, как заданный URL.

Документ Google Sheet

Документ Google Sheet должен содержать два столбца:

  • Первый столбец - заголовок статьи;
  • Второй столбец - тело статьи.

Таким образом, каждая строка документа - это как одна статья в базе знаний.

Сайты и html страницы

Страницы разбиваются на части (чанки) по заголовкам h1, h2, … Например, для такой структуры статьи:

Главный заголовок

Общие данные

подзаголовок 1

Данные 1

подзаголовок 2

Данные 2

получится 3 чанка,

  1. title = h1, headings = [h1], content = “Общие данные”
  2. title = h1, headings = [h1, h2], content = “Данные 1”
  3. title = h1, headings = [h1, h2], content = “Данные 2”

Это важно учитывать при написании страниц, т.к. при поиске ответов Wikibot ищет чанки похожие на вопрос пользователя. Если чанки будут очень маленькие, то каждый из них не будет содержать всего ответа.

Добавление файла

lk-dataset-add-file

Добавление текстовых данных из файла. На данный момент поддерживаются форматы pdf и docx.

Для лучшей индексации docx для всех смысловых заголовков в вашем тексте рекомендуется использовать стили Заголовок 1, Заголовок 2, Заголовок 3 (Heading 1, Heading 2, Heading 3).

После добавления файла он будет автоматически проиндексирован.

Максимальный размер файла - 10 МБ.

Для каждого типа файлов автоматически создается один источник данных:

  • PDF
  • DOCX

Добавление произвольных данных

Укажите заголовок и произвольные текстовые данные, нажмите добавить. Данные будут автоматически добавлены в индекс бота. Также автоматически будет создан источник данных - PRIVATEDATA.

Работа с индексом

Индекс представляет собой набор всех данных, доступных боту для генерации ответа.

Удаление отдельных веб-страниц из индекса невозможно, так как они будут перекачены при следующей перезагрузке веб-сайта. Если какая-то страница является нежелательной, то её можно исключить из индекса. Для этого установите галочку напротив этой страницы и нажмите Удалить из индекса. Добавить в индекс вернет удаленные страницы обратно в индекс.

Вы можете перезагрузить отдельные веб-страницы, если внесли в них какие-то изменения. Для этого поставьте галочки напротив нужных страниц и нажмите Перезагрузить страницы.

Дополнительный контент

Справа от каждой загруженной страницы есть кнопка Подробнее, по которой можно просмотреть набор фрагментов данных по странице и добавить дополнительный контент для лучшего поиска страницы. Если перейти к просмотру фрагментов данных по странице, то появится возможность добавить дополнительный контент на страницу.

Для этого нажмите кнопку “Добавить контент”.

lk-dataset-add-additional-content

Дополнительный контент добавляется в начало каждого фрагмента и позволяет точнее находить статью по время генерации ответа.

Управление источниками данных

lk-dataset-edit-datasource

Нажмите Редиктировать источники данных, чтобы посмотреть все подключенные источники данных.

В этом окне вы можете удалить, перезагрузить или скопировать источник данных.

Удаление источника данных удалит все связанные с ним страницы данных из индекса. Например, удаление источника данных PDF удалит все загруженные файлы формата pdf.