InfoReS - особенности формирования запросов
В технологии InfoStream для
предоставления доступа к документам используется полнотекстовая
информационно-поисковая система InfoReS-XL.
Запросы в системе InfoReS-XL состоят из операндов
(терминов или их правых усечений) и операторов.
Запрос вводится в область ввода текста и
передается поисковой системе при нажатии
на кнопку "Поиск".
В качестве операндов могут использоваться
слова (термины) естественного языка или их правые усечения,
длина которых превышает 2 буквы. По умолчанию
каждый введенный термин воспринимается как правое
усечение, т.е. введя, например, термин "завод",
можно найти документы, содержащие словоформы: "завода",
"заводить", "заводы" и др. При необходимости нахождения точного
вхождения слова, в запросе при вводе следует добавить к
слову символ "]", например, "завод]".
Система не чувствительна к регистрам букв.
В системе InfoReS-XL используется следующий набор операторов:
- ADJ - оператор контекстной близости;
- NOT (AND NOT) - логическое НЕТ, понимаемое как И-НЕТ;
- AND - логическое И;
- OR - логическое ИЛИ.
При употреблении операторов допускается использование
таких сокращений:
- ADJ: "~";
- NOT: "!", "^";
- AND: "&", " " (пробел), "+";
- OR: "|", ",", ";".
Оператор контекстной близости обеспечивает отбор документов,
в которые входят термины, связанные этим оператором. Эти термины
должны находиться в документах в указанной последовательности рядом
друг с другом. По умолчанию предполагается, что это - соседние термины
в документе. Существует возможность задания максимального
расстояния между этими терминами: /0/ - соседние слова (по умолчанию),
/1/ - не более 1 слова между терминами из запроса; /2/ - не более
2-х слов и т.д. Например, запрос "транспорт~/1/нефти"
обеспечивает нахождение документов, в состав которых входят словосочетания
"транспортировка нефти" и "транспорт иранской нефти", в то время,
как запрос "транспорт~нефти" позволит выбрать только документ с первым
словосочетанием.
Запрос может быть многоуровневым.
Различные уровни определяются с помощью круглых скобок.
Пример запроса:
(кофе | какао) & (молот | раствор) ! зерн
Такому запросу удовлетворяют документы, в которых присутствует
термин "кофе" или "какао" (или оба вместе),
а также либо термин "молот" (молотый, молоть и др.),
либо термин "раствор" (растворимый, растворимое и др.),
но при этом отсутствует термин "зерн" (зерно, зерновое и др.).
|