| ||||
|
Як складати пошукові запити Ціль пошуку: знайти повідомлення, що містять потрібну інформацію. Шлях пошуку: викласти потребу природною мовою, та представити її формальною мовою пошукового запиту. Пошукова потреба, виражена природною мовою: Знайти повідомлення, які містять (слова...), чи (слова...), та не містять (слова...). У дужках може бути послідовність слів, які повинні зустрічатись обов'язково, або на вибір, альтернативно, або слів, які не повинні зустрічатись зовсім. Такий узагальнений пошуковий вираз із конкретними словами треба представити елементами формальної мови запиту. Елементи формальної мови: слова природної мови, логічні оператори, які встановлюють відношення між словами, та дужки, за допомогою яких можна вказати послідовність виконання операторів між словами. Логічні оператори встановлюють відношення до слова або між словами:
У загальному випадку, оператор розділяє терми. Терм: це одне слово природної мови (простий терм) або словосполучення, або вираз у дужках. Словосполучення: це складний терм, стійка послідовність слів, суміжних на визначеній у кількості слів відстані. Словосполучення висловлюється
Вираз у дужках - це теж терм, складеній із простих та складних термів, розділених операторами та заключений у дужки. Синтаксис простих термів Слово природної мови, яке розшукується, повинно складатись як мінімум із двох букв, без пробілів та спеціальних символів. Пошукова система не розрізняє прописних і малих літер, тому пошук слів завод і Завод рівнозначний. Кожне слово усікається з кінця до простої форми і розшукується у всіх словоформах. Наприклад, за словом завод можна знайти повідомлення, що містять словоформи цього слова: "заводу", "заводити", "заводи" та інши можливі. Якщо необхідно знайти саме наведене слово, його треба обмежити закриваючою квадратною дужкою ], наприклад, завод]. Синтаксис операторів Надалі, нотація операторів надається у кутових дужках (які не потрібні при складанні реальних запитів), щоб відрізнити від знаків пунктуації цього тексту. Оператори мають міститися між термами та позначуються:
Терми повинні відокремлюватись від оператора пробілом, якщо оператор представлений у виді слів: AND, OR, NOT, ADJ. Наприклад, запит банк&кредит&украин рівнозначний запитам банк кредит украин, або банк+кредит+украин, та забезпечує добір повідомлень, до яких входять усі три терми. Словосполучення Словосполучення - це складний терм, послідовність термів, що будуть розшукуватись у зв'язку один із другим. Між термами словосполучення знаходиться оператор суміжності ADJ. Терми словосполучення можуть сусідувати або розділятися декількома іншими. За замовчуванням, це сусідні слова в повідомленні (між ними відсутні будь-які слова). Відстань у словах між термами словосполучення можна задати явно: /0/ - сусідні слова (за замовчуванням), /1/ - не більш одного слова між термами словосполучення; /2/ - не більш двох слів і т.д. Наприклад, запит транспорт~/1/нафти забезпечує розшук повідомлень, до складу яких входять слова "транспортування нафти" і "транспортування сирої нафти", у той час, як запит транспорт~нафти дозволить вибрати тільки повідомлення з першим словосполученням. Дужки та порядок застосування операторів Перш за все обробляються вирази у дужках, починаючи з найглибшого рівня: спочатку AND, потім OR і в останню чергу NOT. Потім вирази на рівень дужок вище. Тобто, порядок використання операторів у пошуковому запиті може задаватися дужками. Зона пошуку повідомлень Пошук повідомлень можна здійснювати у визначений інтервал дат (Шукати за датою з... по...), серед обраних за назвою продуктів Укрінформу (стрічок, вісників, пакетів,... а також рубрик), або в уже знайденому (Шукати в знайденому). Інакше, пошук виконується серед усіх повідомлень сховища. Приклади пошукових запитів
|
© Укрінформ, 1999-2012 | |
|