Результаты сравнительного изучения глобальных вербальных ипс

№ п/п Параметры Wise-nut Goo-gle AlltheWeb Teoma
Логические операторы(какие конкретно и как задаются)
Синтагматические операторы (какие конкретно и как задаются)
Поиск по полям(составить перечень полей, отмечать их наличие / отсутствие в конкретных совокупностях)
поле 1
поле 2
………
поле k
Выбор поисковой базы данных (в каких ресурсах возможно искать)
ресурс 1
ресурс 2
………
ресурс k
Формат выдачи содержит следующие элементы (под таблицей привести пример из каждой совокупности)
элемент 1
элемент 2
………
элемент k
Особые возможности либо характерные изюминки(обрисовать для каждой совокупности)

Лабораторная работа № 5

(Глобальные вербальные ИПС: поиск и изучение)

1. Совершить поиск по теме «Компьютерная лингвистика» в заданных глобальных ИПС (их количество и набор систем может изменяться по усмотрению учителя). Поисковое предписание логически должно выглядеть следующим образом:

(computational V computing V computer) linguistics.
Запрос задать по-английски два раза, как конъюнкцию и как устойчивое словосочетание (фраза), применяя характерные для каждой совокупности методы выражения операторов (для незнакомых совокупностей отыскать соответствующую справочную данные). Первую веб-страницу с результатами каждого поиска сохранить в собственной папке в виде «лишь html». Количественные результаты отразить в таблице:

№ п/п Наименование ИПС Отыскано документов/сайтов Комментарий (в случае если требуется)
Запрос как конъюнкция Запрос как устойчивое словосочетание
AlltheWeb (Fast)
AltaVista
Гугл
MSN Search
Teoma
WiseNut
Яху

2. Проанализировать и постараться растолковать полученные количества выдачи в каждой совокупности.

3. В трех совокупностях (Яндекс, Рамблер, Гугл) совершить поиск по теме «Компьютерная лингвистика». Поисковое предписание, соответствующее логической формуле «(компьютерная V вычислительная) лингвистика» (дизъюнкция устойчивых словосочетаний «компьютерная и» вычислительная «лингвистика »), задать по-русски, применяя характерные для каждой совокупности методы выражения операторов. Обратить внимание на различия в морфологической нормализации в различных совокупностях. Первую веб-страницу с результатами каждого поиска сохранить в собственной папке в виде «лишь html». Количественные результаты отразить в файле отчета в виде таблицы.

4. Совершить поиск по той же теме, сузив область поиска заданием дополнительных терминов, разрешающих отобрать документы, где самый возможны определения данного термина (учебник, курс лекций, определение, именуется и т.п.). Количество отысканных документов указать в файле отчета. В том же направлении через буфер обмена скопировать поисковые предписания по каждой совокупности.

5. Просмотреть в каждой совокупности отысканные документы, отыскать в них по одному определению термина «компьютерная лингвистика» и записать их в файл отчета с указанием адреса (URL) соответствующего документа.

6. Предъявить работу учителю.

Лабораторная работа № 6

(Глобальные вербальные ИПС: поиск и изучение)

1. Посредством совокупностей Яху, AltaVista, Гугл отыскать материалы по психотерапевтическим (psychological) нюансам компьютера и взаимодействия человека (human computer interaction), размещённые на английском во второй половине 90-ых годов двадцатого века. При составлении поискового предписания в обязательном порядке применять сокращение HCI (human computer interaction). По каждой совокупности первую веб-страницу с результатами поиска и один из документов сохранить в собственной папке в формате «лишь html». Количество отысканных документов и текст поискового предписания в каждой совокупности сохранить в таблице в файле Report6.doc в собственной папке. Цель — знакомство и правильное составление запроса с совокупностями. Текст поискового предписания записать кроме этого в рабочей тетради.

2. Отыскать в совокупности AltaVista фотографии с изображениями Ниагарского водопада (Niagara falls) (поиск в БД изображений — images). Одну из них сохранить как графический файл в собственной папке на диске, а ее URL — в собственной папке в Избранном.

3. Совершить поиск на английском в совокупности Vivisimo по теме «Русская литература». Первую веб-страницу с результатами поиска скопировать в файл отчета.

4. Посредством совокупности AlltheWeb (Fast) распознать материалы на русском по автоматическому синтаксическому анализу. Цель — верное составление поискового предписания. Наилучший вариант поискового предписания через буфер обмена скопировать в файл отчета. Первую веб-страницу с результатами поиска сохранить в собственной папке в формате «лишь html».

5. Применяя совокупности Teoma и WiseNut, отыскать веб-страницы на английском, посвященные изучению аномальных/ паранормальных явлений в Российской Федерации. Для перевода запроса на английский и подбора синонимов воспользоваться сетевыми словарями (www.multitran.ru, Lingvo на сайте Яндекса и др.). Отметить особенности языка запросов в каждой совокупности. Веб-страницу с результатами поиска по каждой совокупности сохранить на диске в собственной папке в формате «лишь html».

6. Предъявить работу учителю.

Лабораторная работа № 7

(ИПС AltaVista и Гугл)

1. Ознакомиться с совокупностью AltaVista (Базы данных, Расширенный поиск, Уточнение формулы запроса (More Precision), Настройки, Домашний фильтр). Установить режимы: База данных: Web — Область поиска: Worldwide — Языки: Russian, English. Установить количество выдачи 30 документов. Совершить поиск по запросу на русском «Карл Маркс. Манифест Компартии». Первую веб-страницу с результатами поиска сохранить в собственной папке в формате «веб-архив, один файл».

2. Один из документов выдачи (текст манифеста) перевести на английский средствами самой совокупности. Текст перевода на английский сохранить.

3. Совершить поиск на английском по тому же запросу в базе данных каталога (Directory) и со страницы с результатами поиска для первых трех документов скопировать в файл отчета раздел(ы) каталога совокупности AltaVista, к каким отнесены эти документы (к примеру, Category: Work Money/Business/Economics/Writers/Marx, Karl).

4. Ознакомиться с совокупностью Гугл (Расширенный поиск, Настройки, Языковые инструменты). Установить язык интерфейса — британский (Настройки). Установить количество выдачи 20 документов. Сократить множество выдаваемых документов германским языком (Расширенный поиск). Совершить поиск по запросу Leningrad. Cкопировать в файл отчета раздел(ы) каталога Гугл, к каким будут отнесены первые три документа. Сохранить в собственной папке в формате «лишь html» первую веб-страницу с результатами поиска и один из документов выдачи на немецком языке.

5. Опять войти в Настройки. Установить язык поиска (язык выдаваемых документов) — любой. Количество выдачи 10 документов. Язык интерфейса — русский. Совершить поиск в ИПС Гугл по базе данных Groups (Группы) в режиме «Расширенный групповой поиск». Отыскать все новостные научные группы сети Relcom (relcom.sci.*). Перечень отысканных групп сохранить в файле отчета. В отысканном перечне выбрать группу relcom.sci.philosophy, просмотреть ее содержимое и обрисовать в файле отчета, в каком виде выдается информация (с примерами, скопированными с экрана).

6. Совершить поиск в ИПС Гугл по базе данных Groups (Группы) в телеконференции relcom.sci.libraries по запросу «Internet in Libraries»: сперва по полю темы (Subject), после этого по всему сообщению, представив запрос как конъюнкцию, после этого по всему сообщению, представив запрос как устойчивое словосочетание (phrase).

7. Потом совершить поиск в Гугл по запросу «Internet in Libraries» в базе данных Web (Веб): сперва по полю заголовка страницы, после этого по всему документу (где угодно на странице), представив запрос как конъюнкцию и как устойчивое словосочетание (phrase).

8. Сравнительные количественные результаты поиска представить в табличном виде в файле отчета:

Поисковая база Область поиска Запрос как конъюнкция Запрос как «phrase»
Группы Тема
Всё сообщение
Веб Заголовок страницы
Целый документ

9. Предъявить работу учителю.

Лабораторная работа № 8

(Глобальные вербальные ИПС: ранжирование выдачи)

1. Применяя совокупности Гугл, Fast (AlltheWeb), Teoma и WiseNut совершить поиск по запросу «Корпусная лингвистика» на английском. Логическая формула: (corpus V corpora) (linguistics V language).

2. Сохранить первую веб-страницу с результатами поиска (10 документов) в каждой совокупности в собственной папке в формате «лишь html».

3. Составить в файле отчета таблицу с количественными результатами поиска.

4. Проанализировать (попарно) совпадение документов в выдаче по каждой совокупности (10 документов):

Гугл Fast Teoma WiseNut
Гугл *
Fast число 1 *
Teoma число 2 число 4 *
WiseNut число 3 число 5 число 6 *

где число_i,— количество совпавших документов.

5. Выписать все совпавшие документы по следующей схеме:

– документы, присутствующие в выдаче (в первой десятке) во всех четырех совокупностях;

– документы, присутствующие в выдаче (в первой десятке) в трех совокупностях;

– документы, присутствующие в выдаче (в первой десятке) в двух совокупностях;
наряду с этим любой документ идентифицировать следующим образом: sN, где s — идентификатор совокупности (соответственно g, f, t либо w), а N — ранг документа в данной совокупности. Так, для документа, представленного в выдаче в трех совокупностях, в файле отчета будет создана, скажем, такая запись: g3—f9—w2, что свидетельствует, что данный документ был отыскан в совокупностях Гугл, Fast, и WiseNut и находится в выдаче этих совокупностей соответственно на 3-м, 9-м и 2-м месте.

6. Проанализировать релевантность первых 10 документов и оценить точность каждой совокупности. Результаты представить в виде таблицы:

№ п/п Наименование совокупности Количество релевантных документов Сумма рангов релевантных документов

6. Предъявить работу учителю.

Лабораторная работа № 9

(Метапоисковые совокупности)

1. Изучить метапоисковые ИПС MetaСrawler (www.metacrawler.com), Profusion (www.profusion.com) и Ixquick Metasearch (www.ixquick. com). Итог — краткий конспект в тетради и функции синтаксис (операторов и поисковый состав) в файле отчета. Перечислить в файле отчета совокупности, через каковые по умолчанию ведется поиск в Profusion. Перечислить виды поиска в Ixquick Metasearch.

2. Совершить сравнительный поиск в Profusion (включив в расширенном поиске совокупности поиск по всем совокупностям (All)) и Ixquick Metasearch по запросу «corpus linguistics». Первые веб-страницы с результатами поиска сохранить в собственной папке в формате «лишь html». В файле отчета обрисовать (продемонстрировать), как в данных совокупностях указывается релевантность (score) отысканных документов. Постараться растолковать, как формируется данный показатель.

3. В совокупности Profusion перейти по ссылке Search Analysis, проанализировать взятую страницу и сохранить ее в собственной папке.

4. Изучить совокупность Kartoo (www.kartoo.com). Совершить поиск по тому же запросу. Первую веб-страницу с результатами поиска сохранить в собственной папке в формате «веб-архив, один файл». Проанализировать результаты поиска и оценить их релевантность. Растолковать назначение и смысл левого фрейма на странице результатов поиска.

5. Совершить сравнительный поиск в MetaСrawler и в Гугл по теме «Психотерапевтические нюансы компьютера и взаимодействия человека». Воспользоваться поисковым предписанием, отлаженным и сохраненным в работе № 6. Проанализировать уровень качества поиска по первым десяти документам. Результаты представить в виде таблицы:

№ п/п Наименование совокупности Количество отысканных документов Количество релевантных документов Сумма рангов релевантных документов
Гугл
MetaСrawler

6. Ознакомиться с совокупностью HotBot. Обратить внимание на возможность поменять входной интерфейс совокупности (Skin Hotbot: Skins | Style Picker | Total CSS Control), на возможность устанавливать фильтры (Preferences), на возможности расширенного поиска, на метапоисковый темперамент данной совокупности. готовься отвечать на вопросы по данной ИПС. Отыскать описание логических операторов языка запросов и скопировать его в файл отчета.

7. Ознакомиться с совокупностью Vivisimo. Обратить внимание на метод представления результатов поиска в данной совокупности (автоматическая кластеризация).

8. Совершить поиск в HotBot и Vivisimo по теме «Морфология». Наряду с этим исключить из поиска медицинскую (medicine) и биологическую (biology, anatomy, cell) тематику. В HotBot сделать это установкой отрицательного текстового фильтра для Google (Preferences: Word Filter: None of these words). Веб-страницу с установленным фильтром сохранить в собственной папке. Первые веб-страницы с результатами поиска сохранить в собственной папке в формате «лишь html». Количественные результаты поиска представить в виде таблицы в файле отчета.

9. Предъявить работу учителю.

General Agreement on Tariffs and Trade (GATT) and North American Free Trade Agreement (NAFTA)


Также читать:

Понравилась статья? Поделиться с друзьями: