l1 list

Вопрос-ответ

Вопрос-ответ или Первая линия или L1 — точные ответы без изменения формулировок в стиле FAQ, либо перевод на оператора по вопросам, которые требуют участия человека.

Если срабатывает Первая линия, то пользователь получает заранее готовый ответ или автоматическое переключение на оператора.

Первая линия отлично подходит для тем, где нужно отвечать строго по регламенту.

Первую линию нужно использовать для переключения на оператора в чувствительных темах, например возвраты или удаление данных.

Добавление

Для добавления ответа нажмите Добавить в правом верхнем углу.

L1 состоит из Главного вопроса и Похожих вопросов. Для каждого вопроса задается один из двух вариантов: переключение на оператора или ответ, в зависимости от выбранного действия.

l1 new

Главный вопрос должен быть довольно узким, иначе он будет срабатывать очень часто.

Чтобы бот лучше понимал Главный вопрос необходимо задать его дополнительные формулировки — Похожие вопросы, но не больше 10 на 1 основной.

Похожие вопросы можно сгенерировать автоматически. После нажатия Сгенерировать приложение автоматически создаст до пяти похожих вопросов. Данная функция тратит 0.1 кредита за одно нажатие.

Тестировать Первую линию удобно на портале в разделе Тестирование. Вы сможете увидеть сработала или нет Первая линия и понять, почему.

Дополнительные рекомендации о настройке Первой линии.

Также для добавления Первой линии вы можете воспользоваться генерацией. Для этого нажмите Сгенерировать в правом верхнем углу. В открывшемся окне вы можете сгенерировать первую линию на основе одного из источников:

  • файл;
  • Google Sheets;
  • описание.
lk-l1-generate

Кроме того, вопросы и ответы для Первой линии можно сгенерировать на основе статьи базы знаний.

Генерация на основе файла или Google Sheets

Для загрузки списка вопросов и ответов предоставьте документ в виде файла в формате XLSX или CSV или ссылки на Google Sheets.

Если вы выбираете загрузку из Google Sheets, убедитесь, что указанный документ доступен для общего доступа всем пользователям.

Документ должен содержать два столбца:

  • первый столбец - вопрос;
  • второй столбец - ответ.

После нажатия кнопки Продолжить, ваш документ будет отправлен на обработку. Для каждого вопроса будут сгенерированы 3 похожих вопроса. Стоимость генерации каждой тройки вопросов составляет 0.1 кредита. Во время процесса генерации будет показан желтый баннер загрузки.

lk-l1-generate-ready

По завершении процесса на этом баннере появится кнопка Просмотреть, которая перенаправит вас на страницу с итоговым списком вопросов и ответов, где вы сможете добавить их в Первую линию.

lk-l1-generate-apply

Генерация на основе описания

Укажите 3 основных вопроса в вашу службу технической поддержки, а также описание вашего бизнеса. При нажатии на Продолжить будут сгенерированы дополнительные 7 вопросов, а также по 3 похожих вопроса для каждого из 10 основных вопросов. Стоимость такой генерации составляет 5 кредитов. По завершении генерации будет показан итоговый список вопросов с возможностью добавить их в Первую линию.

База знаний

dataset

В этом разделе осуществляется работа с данными, по которым бот будет строить ответ.

Для добавления новых данных нажмите Добавить.

Добавление веб-сайта

Для добавления веб-сайта необходимо указать адрес сайта и выбрать парсер.

Парсер по умолчанию подходит для большинства веб-сайтов. Также доступны парсеры, подходящие под конкретные платформы, например Google Sheets или Notion.

Можно выбрать стратегию обхода веб-сайта:

  • Весь сайт - парсинг всех страниц с тем же доменом.
  • Одна страница - парсинг только этой страницы.
  • Папка - парсинг всех страниц, которые начинаются также, как заданный URL.

Документ Google Sheet

Документ Google Sheet должен содержать два столбца:

  • первый столбец - заголовок статьи;
  • второй столбец - тело статьи.

Таким образом, каждая строка документа - это как одна статья в базе знаний.

Сайты и html страницы

Страницы разбиваются на части (чанки) по заголовкам h1, h2, … Например, для такой структуры статьи:

Главный заголовок

Общие данные

подзаголовок 1

Данные 1

подзаголовок 2

Данные 2

получится 3 чанка,

  1. title = h1, headings = [h1], content = “Общие данные”
  2. title = h1, headings = [h1, h2], content = “Данные 1”
  3. title = h1, headings = [h1, h2], content = “Данные 2”

Это важно учитывать при написании страниц, т.к. при поиске ответов Wikibot ищет чанки похожие на вопрос пользователя. Если чанки будут очень маленькие, то каждый из них не будет содержать всего ответа.

Добавление файла

lk-dataset-add-file

Добавление текстовых данных из файла. На данный момент поддерживаются форматы pdf и docx.

Для лучшей индексации docx для всех смысловых заголовков в вашем тексте рекомендуется использовать стили Заголовок 1, Заголовок 2, Заголовок 3 (Heading 1, Heading 2, Heading 3).

После добавления файла он будет автоматически проиндексирован.

Максимальный размер файла - 10 МБ.

Для каждого типа файлов автоматически создается один источник данных:

  • PDF
  • DOCX

Добавление произвольных данных

Укажите заголовок и произвольные текстовые данные, нажмите добавить. Данные будут автоматически добавлены в индекс бота. Также автоматически будет создан источник данных - PRIVATEDATA.

Работа с индексом

Индекс представляет собой набор всех данных, доступных боту для генерации ответа.

Удаление отдельных веб-страниц из индекса невозможно, так как они будут перекачены при следующей перезагрузке веб-сайта. Если какая-то страница является нежелательной, то её можно исключить из индекса. Для этого установите галочку напротив этой страницы и нажмите Удалить из индекса. Добавить в индекс вернет удаленные страницы обратно в индекс.

Вы можете перезагрузить отдельные веб-страницы, если внесли в них какие-то изменения. Для этого поставьте галочки напротив нужных страниц и нажмите Перезагрузить страницы.

Работа со страницами

Справа от каждой загруженной страницы есть кнопка Подробнее, по которой можно просмотреть набор фрагментов данных по странице, добавить дополнительный контент для лучшего поиска страницы, а также сгенерировать вопросы и ответы для Первой линии.

Дополнительный контент

Если перейти к просмотру фрагментов данных по странице, то появится возможность добавить дополнительный контент на страницу.

Для этого нажмите кнопку Добавить контент.

lk-dataset-add-additional-content

Дополнительный контент добавляется в начало каждого фрагмента и позволяет точнее находить статью по время генерации ответа.

Генерация вопросов и ответов

Вы можете сгенерировать вопросы и ответы для Первой линии на основе содержимого страницы. Для этого на странице просмотра нажмите Сгенерировать интенты.

В зависимости от содержимого страницы будет сгенерировано до 10 вопросов и ответов. Стоимость такой генерации составляет 1 кредит.

Во время процесса генерации будет показан желтый баннер загрузки. По завершении процесса на этом баннере появится кнопка Просмотреть, которая перенаправит вас на страницу с итоговым списком вопросов и ответов, где вы сможете добавить их в Первую линию.

lk-dataset-generate-l1

Управление источниками данных

lk-dataset-edit-datasource

Нажмите Редиктировать источники данных, чтобы посмотреть все подключенные источники данных.

В этом окне вы можете удалить, перезагрузить или скопировать источник данных.

Удаление источника данных удалит все связанные с ним страницы данных из индекса. Например, удаление источника данных PDF удалит все загруженные файлы формата pdf.

Глоссарий

Глоссарий позволяет улучшить поиск данных в базе знаний во время ответов на вопросы пользователей. В левой части необходимо указать термин, который используется в вашей документации. В правой части указываются все варианты этого термина (через запятую), которые могут использовать пользователи.

Например, в базе знаний у вас используется термин АЗС, в этом случае в правой части можно указать заправка, автозаправочная станция, бензоколонка

В дальнейшем, во время индексации вопросов Первой линии и данных из Базы знаний все термины из глоссария дополняются его вариациями.

Например, если у вас в Первой линии есть вопрос Адреса АЗС?, то после индексации он станет Адреса АЗС (заправка, автозаправочная станция, бензоколонка)?

Фразы

Фразы позволяют расширить стандартные наборы для определения приветствий, благодарностей и пропусков. Каждая из фраз должна быть расположена в отдельной строке.

Алгоритм работы приветствий

Из сообщения пользователя удаляются все приветствия, если длина итогового сообщения становится меньше трех символов, то всё сообщение рассматривается как приветсвие.

Алгоритм работы благодарностей

Из сообщения пользователя удаляются все благодарности и знаки препинания, если длина итогового сообщения становится меньше 26 символов, то всё сообщение рассматривается как благодарность.

Алгоритм работы пропусков

Из сообщения пользователя удаляются все фразы пропусков, если длина итогового сообщения становится меньше 3 символов, то всё сообщение пропускается и не обрабатывается.

Есть некоторые отличия при работе с включенным агентом. Если есть активная беседа с агентом, то он сам обрабатывает все виды фраз, то есть агент получает все исходные сообщения пользователя без предобработки. Чаще всего приветствие пользователя приходит когда еще нет активной беседы с агентом, поэтому оно обрабатывается по стандартому алгоритму.

Агенты

Агенты позволяют вести полноценный диалог с пользователем с поддержкой истории сообщений. Агент умеет искать данные по базе знаний, Первой линии и задавать дополнительные вопросы пользователю.

При получении запроса от пользователя агент в первую очередь проверяет наличие ответа в Первой линии.

Стоимость обработки сообщений агентом не фиксирована, а варьируется от количества действий, совершенных агентом для ответа. За каждое действие агента, требующее обращение к ИИ, взымается 1 кредит.

Если у вашего бота нет первой линии, то агент не будет искать ответы в ней. Соответственно это может снизить стоимость обработки отдельного сообщения на 1 кредит

Настройка роли

Используйте настройку роли, чтобы ознакомить агента с вашей предметной областью, задать стиль общения и сценарии его работы. Для хорошего описания роли следуйте общим правилам написания инструкций к ЛЛМ:

  1. Четкая роль: Убедитесь, что инструкция устанавливает четкую роль для агента. Это должно хорошо объяснять, что от бота ожидают пользователи.
Ты менеджер по продажам туристического агентсва.
  1. Структурированные инструкции: Ваши инструкции должны включать четкие, корректные и последовательные правила для агента, чтобы улучшить его реакцию на разные запросы.

Если пользователь обращается с просьбой найти тур, то следуй сценарию “Поиск тура”

Сценарий “Поиск тура”:

  1. Уточни город вылета и желаемое направление
  2. Для поиска тура используй запрос формата: Поиск тура “Город вылета” / “Город или страна прилета” *
  3. При первом поиске тура не уточняй дополнительные детали
  4. Предоставляй туры в виде структурированного списка:
    • Город вылета
    • Город прилета
    • Дата вылета и кол-во ночей
    • Цена
    • Ссылка на тур
  5. Если пользователь выбирает тур, то собери данные о туристах: ФИО, номер телефона, кол-во туристов
  6. Когда все данные собраны, то переведи диалог на оператора

В данном примере задается формат, в котором агент будет искать туры по Базе знаний. “Поиск тура” позволяет агенту выбрать документ с заголовком “Поиск тура”, который должен содержать информацию о доступных турах.

  1. Предусмотрение направлений разговора: Важно предусмотреть потенциальные направления диалога и сценарии ошибок.

Если тур не найден, не говори что нет подходящих туров. Переведи на оператора и скажи, что оператор обязательно поможет найти.

  1. Гибкость в ответах: Хорошая роль допускает гибкость в ответах агента, чтобы обеспечить более естественное взаимодействие с пользователем.
Не повторяй свой предыдущий ответ с подобранными турами.
  1. Используйте специфические примеры: Предоставляйте конкретные примеры ожидаемого поведения в ваших инструкциях, чтобы убедиться, что агент понимает, как должен выглядеть его ответ.

Пример диалога:

  • тур
  • Добрый день, подскажите из какого города планируется вылет и какое направление Вас интересует?
  • Турция из Москвы
  • примеры туров…
  • Спасибо, я выберу первый
  • Отлично, скажите Ваши ФИО и номер телефона, чтобы я мог забронировать тур для вас

Ограничения

  • На данный момент агент получает около 10 последних сообщений с пользователем, значение может изменяться как в меньшую так и в большую сторону.
  • Агент не знает текущую дату и время.
  • Для ответа на вопрос агенту доступны данные из базы знаний, которые он искал в последний раз, данные из предыдущих поисков он “забывает”.
  • Агент не умеет считывать информацию с каких-либо сайтов (переходить по URL), кроме той, что добавлена в Базу знаний.