Школа научной информации. Лекция 7. Информационные потребности. Основы информационного поиска
Портал "Богослов.Ru" завершает публикацию материалов проекта "Школа научной информации". Следующий этап развития проекта - проведение практических занятий со слушателями в режиме интернет-конференции (составление рефератов, книжных обзоров, аннотаций, написание рецензий, информационный поиск). О дате начала занятий будет сообщено дополнительно.
Статья


1. Информационные потребности


Одним из центральных понятий информационной науки и практики является понятие информационной потребности (ИПотр). В самом общем смысле под ИПотр понимается необходимость в информации, требующая удовлетворения и обычно выражаемая в информационном запросе.

Например, планирование дальней поездки формирует ИПотр познакомиться с авиационным расписанием. Такое знакомство может быть выполнено в разной форме - по телефону, непосредственно в билетном агентстве в диалоге со специалистом, путем изучения расписания в напечатанном виде или в результате его поиска во всемирной сети. Однако при всем различии форм удовлетворения ИПотр сама она остается одной и той же.

Заметим, что после того, как выбран нужный рейс и куплен билет, информация утратила свою ценность для нас, не перестав при этом оставаться ценной для других потенциальных потребителей. Это свойство полной потери ценности информации (ее потребительной стоимости) для данного потребителя в данный момент, представляет собой важную особенность ИПотр, существенно отличающую ее от других видов потребностей человека. Одна и та же информация может снова стать предметом потребления, если она будет предъявлена другому потребителю, если перед тем же самым потребителем возникнет другая задача, а также если увеличится запас его знаний, позволяющий распознать в этой информации новые аспекты. Здесь уместна аналогия с многократным созерцанием картины или чтением романа мастера.

Таким образом, ИПотр имеют сугубо индивидуальный (персональный) характер. Они зависят не только от особенностей решаемых задач, но также от психологических, образовательных и других личностных особенностей лица, принимающего решение. И хотя при изучении ИПотр их носителей объединяют в группы и категории, все же создатели информационных систем стремятся к тому, чтобы их пользователи имели как можно меньше ограничений в выражении своих вкусов и предпочтений.

Принято выделять два основных типа ИПотр:

• текущие, обусловленные присущей человеку любознательностью и заключающиеся в его стремлении быть в курсе всего, что происходит в мире;

• конкретные (специальные), состоящие в стремлении получить информацию, необходимую для решения конкретной задачи - исследовательской, профессиональной, управленческой и т.п.

Конкретные ИПотр в определенной степени зависят от особенностей задач, для решения которых необходима соответствующая информация. Если ограничиться сферой науки и техники, то их можно разделить на три основных вида:

• ИПотр ученых-исследователей;

• ИПОтр потребности специалистов (инженеров, врачей, агрономов и т.п.);

• ИПотр управляющих (руководителей).

 

ИПотр могут выражаться либо в форме устных или письменных информационных запросов, либо в определенном поведении потребителя по отношению к потенциальным источникам информации (другим людям, литературе, СМИ и др.). Если ИПотр выражена в письменном виде и отчуждена от ее источника, возникает проблема точности и полноты выражения ИПотр в информационном запросе. Специалисты в области информационного поиска различают информацию, имеющую отношение к ИПотр - ее называют релевантной, и информацию, непосредственно удовлетворяющую ИПотр - ее называют пертинентной.

Решающим условием эффективного удовлетворения ИПотр является ясное осознание и четкое выражение того, какая информация действительно нужна потребителю для решения стоящей перед ним задачи. Без этого трудно рассчитывать на получение в информационном центре или библиотеке тех сведений, в которых потребитель нуждается.

Возможный механизм возникновения и удовлетворения ИПотр ученых-исследователей предложен Ю.М. Арским, Р.С. Гиляревским, И.С. Туровым и А.И. Черным в книге «Инфосфера. Информационные структуры, системы и процессы в науке и обществе» (М.: ВИНИТИ, 1996).

С момента возникновения у человека ИПотр он начинает оценивать всю поступающую к нему информацию под углом зрения этой потребности, разделяя информацию на релевантную и нерелевантную. Другими словами, ИПотр возникает у человека при постановке перед ним какой-то задачи. Человек обдумывает эту задачу, в результате чего в соответствующей зоне его долговременной памяти складывается образ задачи или ее внутренняя модель. Этот образ и служит эталоном, с которым с этого момента сравнивается вся поступающая информация. Если информация имеет отношение к эталону, она считается релевантной и заносится в определенную зону долговременной памяти или во внешнюю память (на специальную карточку, в специальную тетрадь или компьютер). Вся не относящаяся к эталону информация считается нерелевантной.

Под влиянием размышлений над сущностью стоящей задачи и содержания накапливаемой релевантной информации представление человека об этой задаче может уточняться и изменяться. Психологи называют этот процесс возрастанием состояния осведомленности о задаче.

Когда человеком накоплено необходимое количество релевантной информации, он находит решение задачи. После этого вся связанная с решением информация переводится из данной зоны долговременной памяти в зону архивного хранения. Таким образом, ИПотр может быть охарактеризована как осознанная нужда в информации, требующейся для решения поставленной задачи по разработанному плану.

Можно предположить, что процесс решения любой научной задачи начинается с принятия каких-либо предпосылок и допущений, которые в дальнейшем подвергаются корректировке и изменению. Под образом или внутренней моделью задачи следует понимать гипотезу, которая является важным средством организации научного поиска. «Гипотезы, - писал Гете, - это леса, которые возводят перед зданием и сносят, когда здание готово; работнику они необходимы; он не должен только принимать леса за здание».

К проблеме ИПотр применимо учение академика АН СССР А.А. Ухтомского (1875-1942) о доминанте, которое является развитием идей Н.Е. Введенского и И.П. Павлова.

В 1898 году студент Московской духовной академии Алексей Ухтомский защищает диссертацию на тему «Космологическое доказательство Бытия Божия», в которой ставит перед собой вопросы «изучения физиологии головного мозга, нервной деятельности вообще, а также физиологии поведения». Он образно формулирует свою цель: «анатомия человеческого духа до религии включительно!» Оставив духовную карьеру, в 1900 году Ухтомский поступает на естественное отделение физико-математического факультета Петербургского университета «для изучения физиологии и подготовительных к ней дисциплин». Спустя три года он начинает работать под руководством физиолога Н.Е. Введенского, а еще через 8 лет выходит его работа, ставшая первой ступенью к развитому позднее учению о доминанте, принесшему ему мировую известность.

В самом общем смысле доминанта (от лат. dominare - господствовать) - это «рабочий принцип» духовности, объясняющий природу человеческого сознания, единый принцип действия и механизм поведения. Пространство души, как и космическое пространство, существует согласно имманентному закону, подчиняющему себе любую нервную деятельность. В коре полушарий головного мозга принцип доминанты служит физиологической основой акта внимания и предметного мышления. Это форма причинности, которая «держит в своей власти все поле душевной жизни человека». Доминанта - это принципиально нарушенное равновесие в нервной системе, когда господствующий очаг возбуждения разгорается, привлекая к себе волны возбуждения из самых различных источников. Одновременно доминанта тормозит все прочие, в том числе и постоянные, раздражители.

Показательна, по Ухтомскому, творческая доминанта - тема, укоренившаяся в сознании ученого, писателя, художника, непроизвольно привлекающая материал отовсюду, из самых неожиданных, подчас даже сомнительных сфер. Здесь она действует как магнит, улавливая нужное и оставляя за бортом внимания все не относящееся к теме. Она дает ученому или художнику «маховое колесо - руководящую идею, основную гипотезу... избавляет мысль от толчков и пестроты и содействует сцеплению фактов в единый опыт».

Философское содержание учения Ухтомского о доминанте представлено в статье С.В. Каликанова, опубликованной в 2003 году в журнале «Вестник Московского университета. Серия философия»: http://www.philos.msu.ru/vestnik/philos/art/2003/kalikanov_uht.htm

Идеям Ухтомского созвучна концепция грузинского психолога Д.Н. Узнадзе (1866/7-1950), в соответствии с которой любая поведенческая реакция человека на любой воздействующий на него стимул определяется «психологической установкой», владеющей им в данный момент. Установка - это общее психологическое состояние личности, которое служит как предпосылкой к действию, направленному на удовлетворение какой-либо потребности, так и регулятором данного воздействия (вне участия сознания).

Узнадзе отмечал, что установка «всегда возникает в результате воздействия объективных обстоятельств и представляет собой такое состояние, в котором отражены сами вызвавшие ее объективные условия. Следовательно, установка - не чисто субъективное состояние, а перенос в субъект объективной ситуации. Она, так сказать, перешедшее в субъект объективное положение вещей».

Активную роль бессознательного в поведении человека подчеркивали З. Фрейд (1856-1939), Г. Лейбниц (1646-1716), И. Гербарт (1776-1841) и другие. Но еще в I в. до н.э. эту мысль высказал в своей поэме «О природе вещей» древнеримский философ Тит Лукреций Кар:

«Если же кто-нибудь занят каким-либо делом прилежно,

Иль отдавалися мы чему-нибудь долгое время,

И увлекало наш ум постоянно занятие это,

То и во сне представляется нам, что мы делаем то же».


Учение о психологической установке позволяет объяснить понятие пертинентности, которое является одним из ключевых понятий в теории информационного поиска. Под пертинентностью понимается соответствие найденных документов или сведений подлинной ИПотр ученого или специалиста, которую нередко он сам может ясно не осознавать.

Из предложенной интерпретации сущности ИПотр и механизма ее удовлетворения следует, что отнесение человеком поступающей к нему информации к категории релевантной или нерелевантной полностью определяется тем, какой образ поставленной задачи сложился у данного человека. Сам этот образ зависит, по крайней мере, от трех следующих факторов:

• информации, которая уже накоплена в его памяти;

• выбранного пути решения задачи;

• темпов и промежуточных результатов решения.

Надо иметь в виду, что образ задачи уточняется или даже изменяется под воздействием поступающей информации и промежуточных результатов решения данной задачи. В связи с этим изменяются и признаки, по которым опознается и отбирается релевантная информация. Поэтому для адекватного информационного обслуживания специалистов необходимо, чтобы оно было не только индивидуальным, но и включало в себя постоянную обратную связь с обслуживаемым абонентом для своевременного учета изменений в его ИПотр.

 

2. Основы информационного поиска

Основным средством передачи научной информации во времени и пространстве был и продолжает оставаться письменный документ. Такая система научной связи существует с момента возникновения науки и в целом успешно выполняет свою функцию.

Возникновение системы научной коммуникации при помощи письменных документов сразу же потребовало организации промежуточных хранилищ, в которых бы последние накапливались и хранились в систематизированном виде. Это давало исследователю возможность производить поиск документов в любое удобное для него время.

Информационным поиском (ИП) называется некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на данные вопросы. Термин «ИП» ввел в информатику американский математик Кэлвин Муэрс в 1947 году.

Побудительная причина ИП - информационная потребность, выраженная в форме информационного запроса. Объектами ИП могут быть документы, сведения о их наличии и (или) местонахождении, фактографическая информация.

ИП различают следующим образом:

• в зависимости от цели - адресный (формально-механический) и семантический (тематический);

• от объекта поиска - документный и фактографический;

• от степени использования технических средств - ручной или автоматизированный.

• в зависимости от функциональной роли - доминирующие/второстепенные, центральные/периферические, устойчивые/ситуативные потребности.

Все виды ИП пересекаются, так как их цели и объекты часто взаимосвязаны. Например, документный и фактографический виды поиска могут быть как адресными, так и семантическими.

ИП производится при помощи информационно-поисковых систем (ИПС). ИПС - это комплекс связанных друг с другом отдельных частей, предназначенный для выявления в каком-либо множестве элементов информации, отвечающих на предъявленный информационный запрос. Массив элементов информации, в котором производится ИП, называется поисковым массивом.

ИПС подразделяются на документальные и фактографические. Документальные ИПС в ответ на вводимые в них информационные запросы выдают оригиналы, копии или адреса хранения документов, содержащих требуемую информацию. Подкласс документальных ИПС, выдающих лишь библиографические описания (БО) искомых документов, иногда называют библиографическими ИПС.

В отличие от документальных ИПС фактографические поисковые системы предназначены для выдачи непосредственно требуемой информации (например, температуры кипения какой-либо жидкости; структурных или молекулярных формул химических соединений, обладающих некоторыми свойствами, и т.д.).

Принципиальных различий между документальными и фактографическими ИПС нет. Если провести аналогию, то документальные ИПС отличаются от фактографических не в большей степени, чем первичные научные документы от справочников. Основным признаком, объединяющим документальные и фактографические ИПС в один общий класс, является то, что и первые, и вторые могут по запросам выдавать такую и только такую информацию, которая была ранее в них введена.

Любая документальная ИПС - от ручной до автоматизированной - включает в себя следующие элементы: информационно-поисковый язык (ИПЯ), правила перевода текстов документов и запросов с естественного языка на ИПЯ, формальные правила (алгоритмы) поиска, технические устройства, реализующие алгоритмы поиска, фонд документов (или их адресов), записанных на каких-либо носителях информации.

ИП осуществляется по определенным правилам, определяющим стратегию поиска, т.е. способы достижения оптимального результата. Стратегия ИП зависит от типа поисковой задачи, критериев выдачи и характера диалога между потребителями информации и ИПС.

В общем случае процедура ИП состоит из четырех этапов:

• уточнения информационной потребности и формулировки запроса;

• определения совокупности держателей информационных массивов;

• извлечения информации из информационных массивов;

• ознакомления пользователя с полученной информацией и оценки результатов поиска.


Наиболее эффективный метод поиска документов, содержащих научную информацию - прочитать каждый документ некоторой библиотеки. Но такой способ практически неосуществим, поскольку число документов обычно бывает слишком большим, чтобы все их можно было прочитывать при каждом информационном запросе. Поэтому приходится использовать другой, менее эффективный метод, при котором ИП производится не по самим текстам документов, а по кратким характеристикам содержания или определенным внешним признакам документов. Для этого каждый документ снабжается поисковым образом документа (ПОД) - характеристикой, в которой кратко выражается основное смысловое содержание документа. В виде такой же краткой характеристики - поискового предписания или поискового образа запроса (ПОЗ) - должен быть сформулирован и информационный запрос. Благодаря этому процедура ИП может быть сведена к простому сопоставлению ПОД с заданным ПОЗ. Если ПОД в необходимой и достаточной степени совпадает с ПОЗ, считается, что этот документ отвечает на информационный запрос. Такое сопоставление оправдано лишь тогда, когда поисковый образ и поисковое предписание формулируются в терминах одного и того же языка, и притом такого, в котором каждая фраза допускает одно и только одно толкование.

В ПОД в краткой форме выражается лишь основное смысловое содержание документа. Поэтому такой метод не может обеспечить отыскания в библиотеке всех документов, содержащих требуемую информацию. Кроме того, в числе найденных документов могут быть такие, которые фактически не отвечают на данный информационный запрос. Эти документы образуют так называемый «поисковый шум».

Важно иметь в виду, что информация, содержащаяся в научных документах, объективно подчиняется закону рассеяния. Полнота и точность поиска представляют собой конкурирующие показатели: повышение одного из них ведет к снижению другого. Увеличивая полноту поиска, мы неизбежно уменьшаем его точность и наоборот, увеличивая точность поиска, уменьшаем его полноту.

Эффективность ИП определяют показатели, характеризующие нахождение релевантных документов. Они делятся на семантические (точность и полнота поиска, коэффициент информационного шума и коэффициент потерь) и технико-экономические (оперативность поиска, стоимость и трудоемкость поиска).

С проблемой ИП раньше всего столкнулись библиотекари. Для того, чтобы читатели могли находить в фондах библиотеки интересующие их документы, в ней создаются различные каталоги и указатели. В одной из крупнейших библиотек древности - в Александрийской библиотеке - к 47 г. до н.э. насчитывалось около 700 тыс. томов (свитков папируса). Составленный Каллимахом каталог к фондам этой библиотеки (примерно в 250 г. до н.э.) имел объем 120 томов. В качестве основных элементов книгоописания в этом каталоге использовалось имя автора и заглавие произведения. Если произведение не имело заглавия, то Каллимах приводил его начальные строки.

Простейшим ПОД является его заглавие. По заглавию книги или статьи читатель в большинстве случаев может судить о том, представляет ли для него интерес эта книга или статья и стоит ли с ней знакомиться подробней.

Аннотация и реферат документа также суть его поисковые образы. С увеличением объема реферативных журналов (РЖ) число помещаемых в них аннотаций и рефератов стало настолько большим, что РЖ пришлось снабжать дополнительным справочным аппаратом - системой указателей, значительно облегчающих для читателей решение информационно-поисковых задач. Таким образом, РЖ, а также РЖ с системой указателей - это простейшие документальные ИПС, рассчитанные на индивидуальное использование.

Существует три основных типа информационно-поисковых задач:

• ретроспективный информационный поиск, т.е. отыскание письменных документов (всех или части), в которых содержатся сведения по определенному вопросу;

• срочное оповещение отдельных специалистов (абонентов) о публикациях, представляющих для них потенциальный интерес. Данный тип информационного поиска называется избирательным (адресным) распределением информации (ИРИ). Он производится по постоянным информационным запросам (так называемым «профилям интересов»), которые формулируются самими потребителями. Это особый случай ИП;

• поиск имен специалистов, располагающих информацией по определенному вопросу.


Лекция 1. Научно-информационная деятельность как разновидность научного труда

Лекция 2. Документальные источники информации. Библиографическое описание и аннотация

Лекция 3. Документальные источники информации. Первичные документы и издания 

Лекция 4. Документальные источники информации. Вторичные документы и издания (часть 1)

Лекция 5. Документальные источники информации. Вторичные документы и издания (часть 2)

Лекция 6. О специфике информационного анализа и синтеза. Индексирование. Реферирование. Перевод научных текстов. Написание обзоров



Комментарии ():
Написать комментарий:

Другие публикации на портале:

Еще 9