Протоколы Internet

         

WAIS


4.5.12 WAIS
Семенов Ю.А. (ГНЦ ИТЭФ)

WAIS (Wide Area Information Server) распределенная система поиска информации. Поиск производится по базам данных, содержащим текстовые документы (но допустимы также графические, звуковые или видео документы). Тематика баз данных и поиска произвольны. Базы данных могут иметь любую структуру, но пользователю не нужно знать языка управления этими базами. WAIS использует естественный управляющий язык. WAIS доступен в Интернет. Для пользователей, имеющих доступ только к электронной почте, предназначен интерфейс, размещенный по адресу waismail@quake.think.com. В сети Интернет существует много серверов WAIS. Список депозитариев серверов достаточно широк, начать можно с анонимного FTP по адресу Think.com секция /wais, файл wais-sources.tar.Z (файл архивирован и пересылка должна осуществляться в режиме BINARY). В настоящее время многие WAIS-сервера интегрированы в сети WEB.

Доступ к WAIS-клиентам возможен и напрямую с помощью команды TELNET по адресам:



 

Авторизация

Место расположения

quake.think.com (192.31.181.1)

(login: wais)

США

sunsite.unc.edu (152.2.22.81)

(login: swais)

США

info.funet.fi (128.214.6.102)

(login: wais)

Финляндия

swais.cwis.uci.edu (128.200.15.2)

(login: swais)

США

kunzu.cnidr.org (128.109.130.57)

(login: wais)

США

nnsc.nsf.net (128.89.1.178)

(alogin: wais)

США

Существуют клиент-серверы WAIS для систем MS-DOS, VMS, MVS, OS/2, UNIX и Macintosh, а также для GNU Emacs, NeXT, X-Windows, MS-Windows, Sunview и т.д. Эти продукты несколько отличаются друг от друга, но обычно процедура содержит следующие шаги:

  1. Пользователь выбирает набор баз данных, где будет проводиться поиск, из числа имеющихся.
  2. Формулируется задание на поиск, выбираются ключевые слова.
  3. В процессе поиска WAIS запрашивает информацию из всех указанных баз данных.
  4. Отображаются заголовки документов, отвечающих критериям отбора. Документы аранжируются согласно их степени соответствия условиям запроса.
  5. Для получения копии пользователь просто отбирает документы из предлагаемого списка.

  6. При необходимости пользователь может переформулировать критерии отбора и повторить поиск.
  7. Вновь найденные документы, если они не совпадают с уже известными будут добавлены в список.

Ниже приводится таблица команд WAIS

Таблица 4.5.13.1. Команды WAIS

Основные команды

h

Выдать перечень команд [help]

?

тоже что и h

q

Уйти из WAIS (quit)

Смена текущей строки

DOWN

Сместиться на одну строку вниз

j

То же, что и DOWN

Ctrl-N

То же, что и DOWN

UP

Сместиться на одну строку вверх

k

То же, что и UP

Ctrl-P

То же, что и UP

число

Переход к строке с указанным номером

/эталон

Перейти к строке, начинающейся с эталона

J

Сместиться на один экран вниз

Ctrl-D

То же, что и J

K

Сместиться вверх на один экран

Ctrl-U

То же, что и K

Выбор источника

Пробел

Выбор или отмена выбора источника

=

Отменить выбор каких-либо источников

RETURN

После выбора источников запрашивает новое ключевое слово

r

Заново отображает результат предшествующего поиска

v

Отображает техническую информацию об источнике

Выполнение поиска

RETURN

Начало поиска после ввода ключевых слов

RETURN

Отображает результат при просмотре результата поиска

w

Запрос новых ключевых слов

s

Повторное отображение первоначального экрана

Чтение статьи

пробел

Отобразить следующий экран

q

Прервать чтение статьи (quit).

Имеется возможность доступа к ресурсам системы WAIS и через электронную почту. Запрос посылается по адресу waismail@quake.think.com, строка Subject игнорируется. Далее (в теле сообщения) могут следовать команды (вертикальная черта (|) указывает на выбор параметров):

help отображение справочного файла
maxres number установка максимального числа искомых документов
search source-name | "source-name1 source-name2 ... " keywords

где: source-name имя источника, как оно было найдено в оглавлении сервера (с или без расширения .SRC). Если нужно провести поиск по нескольким источникам, их имена заключаются в двойные кавычки. keywords ключевые слова, по которым проводится поиск.



Можно сформулировать несколько запросов в одном e-mail. Если имя источника не будет узнано, вы получите список имен возможных источников.

retrieve docid

Извлечение копии документа из базы данных. docid является DocID (идентификатор найденного документа). Если вы посылаете несколько запросов, они должны быть разделены пустыми строками. docid должен строго соответствовать имени документа, полученного вами в результате запроса-поиска (включая пробелы, если они имелись). Могут копироваться не только текстовые документы. Такие документы будут пересланы в формате UUENCODE.

DocID: docid

То же, что и retrieve. Эта форма идентична по форме ответу на поисковый запрос. Процедура делает возможным использовать replay в e-mail для копирования найденных документов.

Примеры использования WAIS

telnet quake.think.com
Trying 192.216.46.98 ... (IP-адрес сервера)
Connected to quake.think.com.
Escape character is '^]'.
SunOS UNIX (wais)
login: wais (ввод идентификатора)
Last login: Sun Aug 27 01:57:07 from france.cityu.edu
Welcome to swais, the text-terminal telnet client to WAIS.
Please type user identifier (optional, i.e. user@host): semenov@ns.itep.ru

(в качестве пароля предлагается напечатать ваш почтовый адрес).

TERM = (vt100) ibmpc (нужно ввести тип терминала, с которым вы работаете)

Starting up. This may take awhile...
SWAIS Source Selection Sources: 549

#

Server

Source

Cost

001:

[ wais.access.gpo.gov]

103_cong_bills

Free

002:

[ wais.access.gpo.gov]

104_cong_bills

Free

003:

[ wais.access.gpo.gov]

1992_cri

Free

004:

[ wais.access.gpo.gov]

1993_cri

Free

005:

[ wais.access.gpo.gov]

1994_cri

Free

006:

[ wais.access.gpo.gov]

1994_hob

Free

007:

[ wais.access.gpo.gov]

1994_record

Free

008:

[ wais.access.gpo.gov]

1994_register

Free

009:

[ wais.access.gpo.gov]

1994_unified_agenda

Free

010:

[ wais.access.gpo.gov]

1995_cri

Free

011:

[ wais.access.gpo.gov]

1995_hob

Free

012:

[ wais.access.gpo.gov]

1995_record

Free

013:

[ wais.access.gpo.gov]

1995_register

Free

014:

[ wais.access.gpo.gov]

1995_unified_agenda

Free

015:

[ archie.au]

aarnet-resource-guide

Free

016:

[ndadsb.gsfc.nasa.gov]

AAS_jobs

Free

017:

[ndadsb.gsfc.nasa.gov]

AAS_meeting

Free

018:

[ munin.ub2.lu.se]

academic_email_conf

Free




Keywords:

<space> selects, w for keywords, arrows move, <return> searches, q quits, ? for Help

Слово Free на правом поле означает бесплатный доступ. Сразу после вывода на экран оказывается подсвеченной позиция <001> (номера позиций проставлены на левом поле). В квадратных скобках приведены адреса серверов, доступ к которым может быть предоставлен, сразу за ним следует наименование базы данных или документа. Используя стрелки <вверх> и <вниз>, можно подсветить нужную вам позицию. После нажатия клавиши <Enter> (или на некоторых клавиатурах RETURN) позиция будет выбрана и вам будет предложена возможность ввести ключевые слова для последующего поиска. Выберем для примера aarnet-resource-guide.src.

Enter keywords with spaces between them; <return> to search; ^C to cancel
Keywords: isdn (в качестве ключевого слова введено ISDN).
Searching aarnet-resource-guide.src...
Initializing connection...
Searching 1995_register
Found 1 items.

SWAIS Search Results

Items: 1

#

Score

Source

Title

Lines

001:

[1000]

(aarnet-resource)

Charles Sturt University

66

<space> selects, arrows move, w for keywords, s for sources, ? for help
Retrieving: Charles Sturt University
Getting "Charles Sturt University" from aarnet-resource-guide.src...
WARNING: terminal cannot "scroll backwards" (press RETURN)

(ниже следует текст документа)

Charles Sturt University

Address:

Division of Information Technology PO Box 588 WAGGA WAGGA 2650

E-mail: cc_director@csu.edu.au Phone: +61 69 222206 Fax: +61 69 222454

Description:

The Division of Information Technology offers computing services for teaching, research and university administration and is a centrally funded support service of the University.

The University has a Facom 340S, VAX 6320 and 6310 systems (VMS), a HP935 (HP-UX), and a SUN 4/75S, as well as a range of workstation-level Unix hosts.

Numerous PC and Mac Networks are spread through the faculties and divisions. ISDN links between the three campuses of CSU bring the ethernet/fibre "backbones" on each individual campus into a single university-wide TCPIP/LAT Network.



Network Access: Systems are generally available via AARNet and Austpac.
Who Can Use:
Computing services are provided to Charles Sturt University community.
Account for outside users are considered on a case by case basis.

Press any key to continue

(для того чтобы продолжить просмотр текста следует нажать любую клавишу).

Возможна и несколько другая форма доступа к WAIS (например, из ЭВМ SUN):

ns> telnet info.funet.fi
Trying 128.214.6.21 ...
Connected to info.funet.fi.
Escape character is '^]'.
SunOS UNIX (info)
Finnish University and Research Network FUNET Information Service
The following information services are available:

gopher

Menu-based global information tool

www

World Wide Web, Global hypertext web

wais

Wide Area Information Server, global databases on different topics

x500

X.500 clients are on nic.funet.fi, login: dua, no password

archie

Database of Internet Archive contents

exit

Exit FUNET information services

Select service (gopher/www/wais/archie/exit) ? wais (выбран WAIS)
Select WAIS interface:
swais VT100-based WAIS client
Select interface (return for back to main menu) ? swais
Supported terminal types are: vt100, xterm
Starting WAIS ..

 

Source Selection

Server Source

Cost

001:

[ archie.au]

aarnet-resource-guide

Free

002:

[ munin.ub2.lu.se]

academic_email_conf

Free

003:

[wraith.cs.uow.edu.au]

acronyms

Free

004:

[ archive.orst.edu]

aeronautics

Free

005:

[ ftp.cs.colorado.edu]

aftp-cs-colorado-edu

Free

006:

[nostromo.oes.orst.ed]

agricultural-market-news

Free

007:

[ archive.orst.edu]

alt.drugs

Free

008:

[ wais.oit.unc.edu]

alt.gopher

Free

009:

[sun-wais.oit.unc.edu]

alt.sys.sun

Free

010:

[ wais.oit.unc.edu]

alt.wais

Free

011:

[alfred.ccs.carleton.]

amiga-slip

Free

012:

[ munin.ub2.lu.se]

amiga_fish_contents

Free

013:

[ 150.203.76.2]

ANU-Aboriginal-EconPolicies

$0.00/minute

014:

[ coombs.anu.edu.au]

ANU-Aboriginal-Studies

$0.00/minute

015:

[ coombs.anu.edu.au]

ANU-Asian-Computing

$0.00/minute

016:

[ coombs.anu.edu.au]

ANU-Asian-Religions

$0.00/minute

017:

[ 150.203.76.2]

ANU-Australian-Economics

$0.00/minute

018:

[ 150.203.76.2]

ANU-CAUT-Academics

$0.00/minute




Российского пользователя не остановит и плата за ресурс, если она составляет $0.00. Выберем позицию agricultural-market-new, а в качестве ключевого слова введем price (кого не интересуют цены на продукты питания?):

Keywords: price
Searching agricultural-market-news.src...
Initializing connection...
Found 40 items. (найдено 40 записей)
SWAIS Search Results Items: 40
# Score Source Title Lines

001:

[1000]

(agricultural-ma)

Re:

MG

LS756

002:

[772]

(agricultural-ma)

Re:

MG

LS754

 

211

003:

[557]

(agricultural-ma)

Re:

AM

LS753

SUP%RIOR VIDEO

277

004:

[514]

(agricultural-ma)

Re:

MG

LS750

 

155

005:

[500]

(agricultural-ma)

Re:

ML

LS143

QUINCY AUCTION,QUINCY

158

006:

[486]

(agricultural-ma)

Re:

WA

PY100

CHICKEN PURCHASES

480

007:

[457]

(agricultural-ma)

Re:

RH

LS751

 

127

008:

[443]

(agricultural-ma)

LS.

MN

LL Re:

USDA 04/26/94 20:51

172

009:

[443]

(agricultural-ma)

Re:

ML

LS144

TOPPENISH (RESEND)

161

010:

[400]

(agricultural-ma)

Re:

KO

LS757

ADA WGTD AVG W/COWS

115

011:

[371]

(agricultural-ma)

Re:

RH

LS764

 

138

012:

[343]

(agricultural-ma)

Re:

KO

LS752

MCALESTER WGTD AVGW/COW

100

013:

[343]

(agricultural-ma)

Re:

MG

LS752

 

91

014:

[343]

(agricultural-ma)

Re:

MG

LS797

 

122

015:

[343]

(agricultural-ma)

Re:

RH

LS750

 

107

016:

[343]

(agricultural-ma)

Re:

RH

LS757

ROCKINGHAM FEEDER CATTLE

140

017:

[343]

(agricultural-ma)

Re:

RH

LS758

STAUNTON UNION FEEDERCA

102

018:

[343]

(agricultural-ma)

Re:

RH

LS795

 

114

<space> selects, arrows move, w for keywords, s for sources, ? for help

Выбираем позицию <3>. Ниже следует текст, выданный в результате на экран.

Retrieving: Re: AM LS753 SUPRIOR VIDEO "Re: SUP%RIOR
VIDEO" from agricultural-market-news.src...
SWAIS Document Display Page: 1
Subject: AM LS753 SUP%RIOR VIDEO
Date: Mon, 21 Aug 95 01:58:17 PM
AM LS753
Amarillo, Texas Mon Aug 21, 1995 USDA-TX Dept of Ag Market News


Superior Video Auction - Final Report - Two day auction Aug 18 & 19.
Offerings < 91,000

Trade and demand moderate to good. Cattle offered from 16 States, Mexico and Canada. Prices based on net weights after a 1-3 percent shrink or equivalent with a 4-10 cent slide on calves and 3-8 cent slide on yearlings. Offerings included 31 percent feeder steers and differs over 600 lbs and 69 percent feeders under 600 lbs.

************************************************************
Press any key to continue, 'q' to quit.
Southcentral States: Texas, Oklahoma, New Mexico,
Kansas and Missouri.
************************************************************

Feeder Steers Medium and Large 1

Head

Weight

Avg Wt

Price

Avg Price

Delivery

220

425-425

425

74.10-74.10

74.10

Current

84

625-625

625

67.35-67.35

67.35

Current

60

850-850

850

62.00-62.00

62.00

Current

190

525-525

525

66.25-66.25

66.25

Septmbr

78

585-585

585

69.35-69.35

69.35

Septmbr

130

740-740

740

64.85-64.85

64.85

Septmbr

382

800-835

821

64.00-66.00

64.96

Septmbr

540

860-860

860

64.35-64.35

64.35

Septmbr

70

360-360

360

77.50-77.50

77.50

Oct+Nov

Press any key to continue, 'q' to quit. (таблица напечатана с сокращениями)

Если вы выдали более одного ключевого слова, тогда все документы, содержащие любое из перечисленных слов будут включены в список найденных.

Если нужно узнать о WAIS больше (библиография, утилиты, исходные тексты), обращайтесь к Barbara Lincoln Brooks из WAIS inc. Библиография доступна по адресу ftp.wais.com в секции /pub/wais-inc-doc. Общую информацию по WAIS можно найти через FTP по адресу: quake.think.com /wais/doc или sunsite.unc.edu /pub/docs/about-the-net/libsoft/wais.txt. Для любителей доступа через WWW: www.wais.com или www.earn.net. Те же, кто для целей поиска предпочитает gopher, могут воспользоваться сервером: gopher-gw.micro.umn.edu. Можно узнать кое-что о WAIS и через telnet: quake.think.com Login: wais.

Программы доступны по адресам (FTP): ftp.cnidr.org ftp.wais.com quake.think.com sunsite.unc.edu

По вопросам получения бесплатного программного обеспечения обращайтесь по адресу: freewais@cnidr.org. Подписной почтовый лист имеет адрес: wais-discussion@wais.com. Для подписки посылайте запрос по адресу (формат запросов описан в разделе LISTSERV): wais-discussion-request@wais.com. Группа новостей в USENET (FAQ): comp.infosystems.wais; полезную информацию можно получить и через анонимное FTP по адресу rtfm.mit.edu в каталоге /pub/usenet/news.answers/wais-faq.



Содержание раздела