WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ О НОВОМ ПОДХОДЕ К СЕМАНТИЧЕСКОМУ ПРЕОБРАЗОВАНИЮ ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ЗАПРОСОВ ПОИСКОВЫХ СИСТЕМ А.В. Кириллов, аспирант кафедры Инноваций и бизнеса в сфере

информационных технологий факультета бизнес-информатики Национального исследовательского университета «Высшая школа экономики», e-mail: antonv.kirillov

В.А. Фомичев, доктор технических наук, профессор кафедры Инноваций и бизнеса в сфере информационных технологий факультета бизнес-информатики Национального исследовательского университета «Высшая школа экономики», e-mail: vfomichov@hse.ru.

Адрес: г. Москва, ул. Кирпичная, д. 33/5.

В статье рассматриваются существующие подходы к поиску информации, анализируются их основные недостатки. Предлагается новый подход к поиску информации, основанный на семантическом преобразовании поисковых запросов. В рамках предлагаемого подхода выделя ются классы естественно-языковых запросов, предлагаются формальная модель проблемно ориентированной системы первичных единиц концептуального уровня и метод построения семантического расширения поискового запроса, а также иллюстрируется применение метода.

Ключевые слова: семантический поиск, семантический анализ, теория К-представлений, естественно языковые запросы, поисковые системы.

Введение запросу. Для определения релевантности доку ментов используется большое разнообразие мето есмотря на большое разнообразие подхо дов, таких как VSM (векторно-пространственная дов к поиску информации [1, 2, 3], фун модель), функции BM25 и BM25F (учитывающие Ндаментальной проблемой при разработке поисковых систем является определение релевант- различные весовые факторы слов в документе), ности – ситуации, когда документ соответствует функции Okapi, Ponte, алгоритм LCA и другие.

БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ Однако системы, реализующие поиск по ключевым случаев недоступно, алгоритмизация создания словам, сталкиваются с серьезными проблемами, данного описания является весьма трудоемкой за связанными с качеством результатов поиска. Часто дачей, технологии семантического веба и гипер возникает ситуация, когда результаты поиска раз- текстового поиска развиваются параллельно и не зависимо друг от друга, предлагается реализовать личны для двух запросов с одинаковым смыслом, семантически-ориентированную поисковую систе но отличающихся грамматически.

му, выполняющую преобразование поискового за Семантическая поисковая система в ее класси проса, в зависимости от его типа, в форму, позво ческом виде оперирует с мета-данными, описы ляющую синтаксической поисковой системе найти вающими документы. Данное описание хранится адекватное подмножество документов, семанти в таких форматах, как RDF, RDFS, OWL и другие.

чески соответствующих ожиданиям пользователя.

Мета-информация позволяет получить семанти Данный подход оперирует с разными типами во ческое описание содержимого документов. В на просов на естественном языке и позволяет созда стоящее время семантические поисковые системы вать семантическое описание для каждого из них. В используют большое разнообразие методов и тех случае, если какой-то из введенных пользователем нологий, большинство которых основано на ана вопросов не может быть проанализирован, пользо лизе естественного языка. Подходы, применяемые ватель получит результаты работы системы поиска в последние годы в семантическом поиске, весьма по ключевым словам.

разнообразны: увеличение семантической реле Для успешного выполнения преобразования по вантности посредством дополнительного синтак искового запроса к расширенному виду необходи сического анализа и использования обнаруженных мы следующие обязательные элементы:

данных RDF [3], анализ поисковых запросов и до 1. Математическая модель проблемно-ори кументов на основе триплетов с использованием ентированной системы первичных единиц концеп онтологии предметной области [4], использование туального уровня, используемых поисковой систе автоматически сгенерированных онтологий при мой.

поиске [5], вопросно-ответные системы на основе 2. Математическая модель многообразия смысло семантических графов и анализа триплетов [6], из вых структур как ориентир для построения семан влечение семантических отношений естественного тических представлений естественно-языковых по языка с помощью шаблонов грамматических зави исковых запросов.

симостей [7] и многие другие.

3. Математическая модель лингвистической базы Хотя сегодня имеется много различных подходов знаний, позволяющая связать семантическое пред к семантическому поиску в Интернете, остают ставление поискового запроса с его грамматиче ся не полностью решенными следующие задачи:

ским и семантическим окружением.

разработка естественно-языковых анализаторов 4. Алгоритм преобразования поискового запроса поисковых запросов, определение типа вопроса, в первичное семантическое представление с после определение объекта интереса поискового запроса, дующим анализом и расширением.

определение предметной области либо областей, 5. База знаний, отражающая взаимосвязи семан к которым может относиться поисковый запрос, тических единиц, а также включающая механизм определение принадлежности найденных докумен определения отношений между ними.

тов той же предметной области, что и объект инте Анализ научной литературы показал, что теория реса поискового запроса, поиск синонимов объекта К-представлений, предложенная В.А. Фомичевым интереса поискового запроса и некоторые другие.

[1, 8], по ряду характеристик наиболее удобна для Решение данных задач достигается предлагаемым решения поставленной задачи создания семанти подходом к семантически-ориентированному по ческого представления поискового запроса.

иску.

Описание предлагаемого подхода Типизация запросов на естественном языке Предлагаемый подход к реализации семан тически-ориентированного поиска базируется на По результатам проведенных исследований следующих положениях: в силу того, что семан- были выявлены, проанализированы и сгруппиро тическое описание документов в большинстве ваны вопросы на естественном языке, а также вы БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ делены следующие группы вопросов и методы их может быть поставлен каждый реляционный сим обработки:

вол (под X и Y будем понимать объекты интереса общие (традиционные вопросы, не касающие- поискового запроса, если не указано другого):

ся специфики того или иного объекта интереса). В (1) Описание_структуры – данный символ пред процессе преобразования запросов будут использо назначен для представления вопросов вида «Как ваны синонимы, гипонимы и гиперонимы объекта устроен X?». Например: «Как устроен двигатель интереса запроса, на этапе анализа возвращаемых внутреннего сгорания?»;

документов будут использоваться антонимы объек (2) Описание_характеристик – данный символ та интереса предназначен для представления вопросов вида аспектно-ориентированные (вопросы, касаю «Каковы характеристики X?». Например: «Каковы щиеся характеристик объекта интереса, либо его характеристики автомобиля Mercedes ML 350?»;

особенностей). При анализе определяется принад (3) Описание_работы – данный символ пред лежность объекта интереса к предметным обла назначен для представления вопросов вида «Как стям, используются определения, синонимы, анто работает X?». Например: «Как работает аппарат нимы и т.д.

магнитно-резонансной томографии?»;

вопросы, касающиеся сохранения или измене (4) Описание_функций – данный символ предна ния состава того или иного множества;

при анализе значен для представления вопросов вида «Каковы используется база знаний, содержащая некоторый функции X?». Например: «Каковы функции систе набор сведений о тех или иных объектах и множе мы менеджмента качества?», «Какие функции вы ствах объектов.

полняет сервер локальной сети?»;

вопросы достижения целей (вопросы, связан (5) Описание_назначения – данный символ пред ные с успехами и неудачами тех или иных интел назначен для представления вопросов вида «Для лектуальных систем).

чего предназначен X?», «Каково назначение X?».

Формализация обработки перечисленных вопро Например: «Для чего предназначен реостат?», «Ка сов, помимо общих, ранее в доступной научной ли ково назначение межкомпьютерной связи?»;

тературе не рассматривалась.

(6) Описание_применения – данный символ пред В рамках проводимого исследования была выде назначен для представления вопросов вида «Где лена группа наиболее актуальных и практических используется X?», «Как применять X?». Например:

значимых вопросов для их детального анализа и «Где используется Java?», «Как применять актив разработки алгоритма семантического преобразо ную XSS?»;

вания, а также алгоритма обработки данного вида (7) Описание_принадлежности – данный символ вопросов. Таковыми являются вопросы аспектно предназначен для представления вопросов вида «К ориентированного типа. Введем формальное опре какому классу принадлежит X?», «К какой катего деление аспектно-ориентированных вопросов.

рии относится X?». Например: «К какому классу Аспектно-ориентированными вопросами будем на соединений относятся жиры?», «К какой категории зывать вопросительные предложения, в которых относятся офисы?»;

запрашивается информация, касающаяся различ (8) Описание_различий – данный символ предна ных аспектов того или иного объекта или системы.

значен для представления вопросов вида «Чем от Такими аспектами могут являться характеристики, личается X от Y?», «В чем разница между X и Y?».

условия существования или функционирования, Например: «Чем отличается архитектура x86 от назначение, структурная организация, функции, x64?», «В чем разница между процессорами Dual области применения, принадлежность к какому Core и Core 2 Duo?»;

либо классу, принципиальные отличия, особенно (9) Описание_общих_характеристик – данный сти и возможности различных объектов и систем.

символ предназначен для представления вопросов Для представления различных аспектов необхо вида «Что общего у X с Y?», «Каковы общие черты димо ввести реляционные символы, строго соот X и Y?». Например: «Что общего у резины и каучу ветствующие тому или иному аспекту объекта или ка?», «Каковы общие черты финансов и денег?»;

системы. Были выделены 11 основных аспектов, и (10) Описание_особенностей – данный символ для каждого из них введен специальный реляци предназначен для представления вопросов вида онный символ. Рассмотрим данные символы, их «Как ведет себя X [в ситуации Y]?», «Каковы осо смысл и пример вопроса, в соответствие которому бенности работы X [в условиях Y]?», где X – объект БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ интереса поискового запроса, а Y – опциональная ным);

Tol – бинарное отношение на St, являющееся часть вопроса, уточняющая вопрос, служащая до- антирефлексивным и симметричным, и выполня полнительным условием (ограничением). Напри- ется несколько дополнительных условий.

мер: «Как ведет себя аргон при повышенном дав Элементы множества St называются сортами;

Р – лении?», «Каковы особенности работы буровой сортом «смысл сообщения»;

Gen St St – отноше установки при высокой температуре?»;

нием общности;

Tol St St – отношением совме (11) Описание_возможностей – данный символ стимости (толерантности). Если пара (u, t) входит в предназначен для представления вопросов вида Gen, то можно использовать эквивалентную запись «Каковы возможности X?». Например: «Каковы u t и говорить, что t – конкретизация сорта u, а u возможности платформы.NET?».

– обобщение сорта t. Если (s, u) Tol, то использу Следует отметить, что перечисленные виды во- ется запись s u и говорится, что сорт s совместим просов могут и должны дополняться новыми ти- с сортом u.

пами для обеспечения большей степени покрытия Отношение общности Gen отражает существова потребностей поисковой системы. Для поддержки ние иерархии (по степени общности) наиболее об построения семантического представления поис щих понятий – сортов. Например, для некоторого ковых запросов необходима гибкая расширяемая к.б. B отношение Gen может включать пары (физич.

математическая модель системы первичных единиц объект, динамич. физич. объект), (физич. объект, концептуального уровня. Построим такую модель, физич. объект). Отношение совместимости Tol от используя в качестве отправной точки определения ражает существование различных, несопоставимых сортовой системы и концептуально-объектной си («ортогональных») семантических характеристик стемы из [1, 8].

некоторых сущностей из рассматриваемой группы предметных областей. Например, человек одно временно является интеллектуальной системой и Математическая модель динамическим физическим объектом. Поэтому для проблемно-ориентированной системы некоторого к.б. B отношение Tol может включать первичных единиц концептуального уровня пару (интел. система, динамич. физич.объект) и, в В монографиях [1, 8] вводится базовая матема силу рефлексивности отношения, пару (динамич.

тическая модель для описания системы первичных физич. объект, интел. система).

единиц концептуального уровня, используемых Пусть S – сортовая система вида (St, Р, Gen, Tol).

прикладной интеллектуальной системой. Эта мо Тогда произвольная упорядоченная четверка Ct дель определяет новый класс формальных объек вида (X, V, tp, F) в [1, 8] называется концептуально тов, называемых концептуальными базисами (к.б.).

объектной системой, согласованной с сортовой си Каждый к.б. B строится для формализации опре стемой S когда выполняются следующие усло деленной группы предметных областей и задает вия:

формальный язык Ls(B), называемый СК-языком (1) X, V – счетные непересекающиеся множества (стандартным концептуальным языком) в базисе B.

символов;

tp – отображение X V Tp(S);

Язык Ls(B) предназначен для построения семанти (2) F – непустое подмножество множества X, для ческих представлений (СП) произвольно сложных каждого r F цепочка tp(r) начинается с подцепоч текстов, относящихся к рассматриваемой группе ки «{(« и заканчивается подцепочкой «)}»;

областей. Произвольный к.б. B является упорядо (3) St – непустое конечное подмножество множе ченной тройкой вида (S, Ct, Ql ), где S, Ct – фор ства X, и для любого s St выполняется соотноше мальные объекты, называемые соответственно ние tp(s) = s;

сортовой системой и концептуально-объектной си (4) {v V| tp (v) = [сущ]} - счетное множество.

стемой, а Ql – формальный объект, называемый Множество X называется первичным информаци системой кванторов и логических связок.

онным универсумом, элементы множеств V и F назы Сортовой системой в [1, 8] называется произволь ваются соответственно переменными и функциональ ная упорядоченная четверка S вида (St, Р, Gen, Tol), ными символами. Если элемент d X V, tp(d) = t, то где St – конечное множество символов;

Р – элемент будем говорить, что t – тип элемента d.

множества St;

Gen – непустое бинарное отношение на St, являющееся частичным порядком на St (т. е. Элементы множеств X и V интерпретируются как рефлексивным, транзитивным и антисимметрич- элементарные блоки, из которых (и нескольких БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ служебных символов) будут строиться семанти- ориентированная сортовая система, Ctmw – слабо ческие представления предложений и дискурсов. размеченная концептуально-объектная система Например, X может включать элементы город, от- вида (X, V, tp, F, Qf), согласованная с S. Тогда упо грузка1, 125, 3/тонна, зелен, контейнер1, Столица, рядоченный набор Cobs вида (X, V, tp, F, Qf, Chr, Qnf, Вес, Цена, Часть, Элемент-множества, V может со- Fgn) будем называть размеченной концептуально держать символы x1, y3, z12, F может включать эле- объектной системой, согласованной с сортовой си стемой S когда выполняются следующие усло менты Столица, Вес, Цена.

вия:

Определение 1. Пусть S – произвольная сортовая 1. Набор (X, V, tp, F, Qf) является слабо размечен система вида (St, P, Gen, Tol), где St – множество ной концептуально-объектной системой, согласо сортов, P – выделенный сорт «смысл сообщения», ванной с сортовой системой S;

Gen – отношение общности на St, Tol – отношение 2. Chr – выделенное конечное подмножество совместимости на St (см. [1, 8]). Тогда сортовую си множества унарных функциональных символов стему S будем называть аспектно-ориентированной F[1] (интерпретируется как множество характери когда стик объектов заданной предметной области);

(1) St включает выделенные, попарно различные сорта техн.устр, физ.об;

3. Qnf – конечное подмножество множества (2) (физ.об, техн.устр) Gen;

F[1] \ Chr (смысл элементов этого множества заклю (3) {u St | (P, u) Gen} {физ.об, техн.устр} =. чается в представлении характеристик, не принадле жащих объекту интереса поискового запроса);

Сорта техн.устр и физ.об интерпретируются как обозначения понятий «техническое устройство» и 4. Пусть Concepts – множество всех таких d «физический объект». из X, что тип tp(d) начинается с символа (т.е.

d – обозначение понятия).Тогда Fgn – это функ Определение 2. Пусть S – произвольная ция, ставящая в соответствие произвольному s аспектно-ориентированная сортовая система, Ct – из Concepts упорядоченную четверку Gn = (Ge, концептуально-объектная система вида (X, V, tp, Concr, Syn, An), где Ge – множество обобщающих F), согласованная с сортовой системой S, где X – понятий объекта интереса поискового запроса, множество символов (первичный информацион Concr – множество конкретизирующих понятий ный универсум), V и F – множества переменных и объекта интереса поискового запроса, Syn – мно функциональных символов соответственно. Если эле жество синонимов (на концептуальном уровне) мент d X V, tp(d) = t, то будем говорить, что t — объекта интереса поискового запроса, An – мно тип элемента d. Тогда упорядоченная пятерка вида жество антонимов объекта интереса поискового Ctmw = (X, V, tp, F, Qf) называется слабо размеченной запроса, причем Ge, Concr, Syn, An – это подмно концептуально-объектной системой, согласованной жества множества Concepts. Функцию Fgn будем с сортовой системой S когда выполняются сле называть детерминантом концептуального окру дующие условия:

жения;

если s – элемент множества Concepts, то (1) X\F включает подмножество Qf = {r1,..., r11}, упорядоченная четверка Gn(s) = (Ge, Concr, Syn, n = 11, где An) будет называться концептуальным окружени r1 = описание_структуры, ем термина s.

r2 =описание_характеристик, r3 =описание_работы, Метод построения r4 =описание_функций, семантического расширения r5 =описание_назначения, поискового запроса r6=описание_применения, Рассмотрим шаги, необходимые для построения r7 =описание_принадлежности, семантического расширения поступившего поис r8 =описание_различий, кового запроса на основе предлагаемой математи r9 =описание_общих_характеристик, ческой модели.

r10 =описание_особенностей, На первом шаге необходимо проанализировать r11 =описание_возможностей;

поступивший на вход поисковый запрос с це (2) tp(r1 )=tp(r2 )=...tp(r11 ) = {(физ.об, P)}.

лью определения его типа. Для этого необходи Определение 3. Пусть S – произвольная аспектно- мо использовать определение слабо размеченной БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ концептуально-объектной системы вида Ctmw=(X, Пример построения V, tp, F, Qf), а именно, установить соответствие семантически преобразованного поискового запроса одному из элементов мно- множества поисковых запросов жества Qf = {r1,..., r11}. Например, поисковому за Проиллюстрируем на примере построение сна просу = «Каковы характеристики платформы чала концептуального окружения термина s из от J2EE?» будет соответствовать реляционный символ дельно взятого поискового запроса на естествен r2 Qf | tp(r2) = {(физ.об, P)}, что означает, что дан ном языке и затем – семантического расширения ный запрос имеет тип «Описание_характеристик».

запроса. Пусть задан запрос = «Каковы особен После того, как определен тип вопроса, необходи ности компьютера MacBook Pro?». Данный поис мо выделить первостепенный и второстепенный ковый запрос относится к типу (10), описанному объекты интереса поискового запроса. Перво ранее, и соответствует реляционному символу Опи степенным объектом интереса будет являться сание_особенностей. Первостепенным объектом = «характеристика», а второстепенным = 1 интереса данного запроса являются особенности «платформа J2EE».

определенного объекта, в данном случае – компью После определения основных характеристик за- тера MacBook Pro, а не сам компьютер. Пусть s = проса можно переходить к созданию множества «особенности», тогда для определения лексикогра вторичных поисковых запросов, порождаемых за- фического окружения нам необходимо привести данное слово к нормальной форме (именительный просом, т.е. к построению семантического рас падеж, единственное число, т.к. это существитель ширения входного запроса. Построение данного ное). Информация для преобразования такого типа множества происходит на основании размеченной традиционно содержится в лингвистической базе концептуально-объектной системы Cobs вида знаний, описание которой не затрагивается в дан (X, V, tp, F, Qf, Chr, Qnf, Fgn). Расширение поисково ной работе, однако наличие таковой необходимо го запроса происходит при помощи детерминанта для реализации предлагаемого подхода. Нормали концептуального окружения Fgn. Таким образом, зованный термин s’ = «особенность», в таком случае необходимо построить набор Gn(s’) = ({свойство, черта},{}, {непохожесть, отли Gn = (Ge, Concr, Syn, An ).

чие}, {сходство, похожесть}).

Для = «характеристика» Gn будет включать 1 Как видно из построенного концептуального следующие элементы:

окружения, данный термин не имеет конкрети зирующих понятий. Построение семантического Ge = {отзыв, рекомендация}, расширения поискового запроса осуществляется Concr = {описание}, следующим образом: сначала добавляется перво Syn = {портрет, описание}, An =.

начальный поисковый запрос, затем поисковый Как только расширенное множество запросов запрос, использующий синонимы объекта инте сформировано, оно передается в традиционную реса, затем поисковый запрос с конкретизирую поисковую систему, возвращающую множество щими понятиями и, наконец, поисковый запрос, релевантных документов. При анализе докумен построенный с использованием обобщающих по тов будут использоваться такие компоненты раз нятий термина s. Следует отметить, что построе меченной концептуально-объектной системы, как ние концептуального окружения проводилось для множества Chr для определения степени соответ нормализованного термина s’. Для построения ствия информации в документе характеристикам, грамматически равносильных поисковых запросов присущим заданному объекту интереса, и Qnf для необходимо выполнить денормализацию лексико фильтрации документов, содержащих нерелевант- графического окружения и привести его в ту форму, ную информацию. Кроме того, для фильтрации в которой находился термин s в поисковом запросе, нерелевантных документов используется множе- т.е. Gn(s) = ({свойства, черты},{},{непохожести, ство антонимов An из концептуального окру- отличия},{сходства, похожести}). Результирую жения термина. Предполагается, что данные щее множество поисковых запросов будет выгля множества формируются в зависимости от пред- деть так: Wse = {«Каковы особенности компьютера почтений пользователя, т.е. в зависимости от его MacBook Pro?», «Каковы непохожести компью поведения и выбора тех или иных результатов по- тера MacBook Pro?», «Каковы отличия компью иска. тера MacBook Pro?», «Каковы свойства компью БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ тера MacBook Pro?», «Каковы черты компьютера интереса. В представленном примере множество Wse MacBook Pro?»}. примет следующий вид: Wse’ = {«MacBook Pro осо бенности», «MacBook Pro непохожести», «MacBook Однако, несмотря на проведенные преобразова Pro отличия», «MacBook Pro свойства», «MacBook Pro ния, результат работы поисковой системы не будет черты»}. Изменение порядка и количества слов по удовлетворительным из-за вопросительной струк зволяет с наибольшей точностью найти документы, туры поискового запроса, которая редко встречает содержащие необходимую информацию. Элементы ся в документах, содержащих описания подобных представленного множества поисковых запросов с характеристик заданного объекта. Поэтому необхо большей вероятностью встречаются в различных до димо выполнить стемминг поисковых запросов.

кументах, что позволяет избежать ограничения лишь Следует пояснить, что в традиционном поиске по по документам, содержащим описание непосред нятие стемминга термина поискового запроса озна ственно «особенностей» данного объекта.

чает сохранение лишь основы слова, чтобы избежать Приведем пример результатов работы поисковой зависимости от различных словоформ, встречающих системы (в данном случае — Яndex) для первона ся в разных документах. Для поискового запроса в це чального поискового запроса и для множества сге лом стеммингом будет являться сокращение данного нерированных запросов:

запроса до семантически значимых составляющих, т.е. до первостепенных и второстепенных объектов Таблица 1.

Сравнение результатов выдачи поисковой системы w = «Каковы особенности компьютера Wse’ = {«MacBook Pro особенности», «MacBook Pro непохожести», MacBook Pro?» «MacBook Pro отличия», «MacBook Pro свойства», «MacBook Pro черты»} re: Store — Apple MacBook Pro 13 Apple - MacBook Pro - Спецификации 15-дюймовой модели Ноутбук, блок питания имеет следующие для снижения воздействия на окружаю MagSafe, шнур питания, адаптер, диски с ПО, щую среду: корпус из алюминия и стекла, пригодный для вторичной переработки;

экран салфетка для очистки экрана, документация. со светодиодной подсветкой, не содержащий ртути Отличительные особенности… Apple - MacBook Pro - Производительность - Скоростные процессоры...

В от систем, где модули памяти подключены к процессору через отдельный Ремонт ноутбуков MacBook от Apple, контроллер, в новом используется интегрированный контроллер памяти, срочный ремонт MacBook Pro...

с которым можно подключать память напрямую к процессору.

Здравствуйте, у меня на сначала перестал записивать дисковод, а потом там Apple MacBook Pro -- Обзоры -- mobi.ru остался диск и он не выдает его обратно, какова Главная внешности — минимализм. Ничего лишнего, ни единого ориентировочная стоимость ремонта? Ответ...

декоративного элемента.

Top List: Ноутбуки - обзор Apple MacBook Pro. Характеристика. Описание Мидис Запорожье:: Ноутбук Apple Дорожные свойства. Первое, что ощущается, когда берёшь MacBook Pro Компьютеры и ноутбук...

в руки – это его совсем небольшая толщина.

Всю необходимую информацию о вы найдёте на сайте Apple.com: видеоруко Замена жёсткого диска в MacBook Pro - Все о продукции Apple водства по iLife, OS X, Aperture и другие Замена жёсткого диска в моём прошла просто замечательно… Каждая материалы. Узнайте об нового из моделей обладает своими особенностями, придающими ноутбукам определенные. Прочтите советы по работе с ним.

, полезные в тех или иных...

Из результатов, представленных в таблице 1, Построение лингвистической базы знаний видно, что пользователь получает более широ Построение семантических представлений аспек кий набор результатов, удовлетворяющих его за тно-ориентированных поисковых запросов долж просу. Более того, в результатах не будут присут но поддерживаться лингвистической базой знаний.

ствовать вопросительные слова. В дальнейшем Лингвистическая база знаний (ЛБЗ) необходима для планируется использовать специализированную хранения информации о грамматических свойствах базу знаний, содержащую определения объектов слов, для определения семантического контекста интереса поискового запроса и некоторую допол того или иного слова, для построения взаимосвязей нительную информацию, которая может быть ис- между словами, а также для добавления определений пользована при анализе результатов работы по- значений слов и построения иерархии понятий. Для исковой системы. построения такой базы требуется адекватная мате БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ матическая модель. В теории К-представлений [1, 8] поиска за счет реализации естественно-языкового предлагается математическая модель лингвистиче- интерфейса, построения семантически близких, но ской базы данных, которая частично удовлетворяет грамматически отличающихся запросов, а также поставленным требованиям. Тем не менее, предло- возможности использовать базу знаний, содержа женная модель не учитывает взаимосвязи между сло- щую информацию о семантических единицах.

вами, которые являются синонимами, антонимами, Введенное формальное определение разме меронимами, холонимами, гиперонимами и гипони- ченной концептуально-объектной системы, по мами. Для определения данных связей между слова- сравнению с введенным В.А. Фомичевым в тео ми предложенную математическую модель ЛБД не рии К-представлений понятием концептуально обходимо дополнить функцией, ставящей заданному объектной системы (см. [1, 8]), позволяет:

слову в соответствие его расширенное лексикографи конструировать иерархию понятий (а не только ческое окружение в зависимости от значения и пред сортов) по степени их общности;

метной области, которой принадлежит данное слово.

ставить в соответствие понятию его лексико Помимо этого, требуется найти такой источник дан графическое окружение;

ных, который позволил бы наполнить построенную определять обобщающие, уточняющие и ана модель фактическими данными. Существующие в логичные семантически, но отличающиеся синтак настоящее время коллективно разрабатываемые базы сически понятия (с помощью функции «детерми знаний Wiktionary и Wikipedia [9] имеют ряд преиму нант концептуального окружения понятия»);

ществ по сравнению с такими традиционными реше выделить подкласс информационных единиц с ниями, как WordNet [10] и некоторые его разновид отрицательным значением.

ности [9]. Тем не менее, данные источники данных не Предложенная формальная модель полностью под являются полностью приемлемыми в силу различных держивает процесс преобразования поискового запро структурных и технологических ограничений. В на са к расширенному виду, связанный с построением стоящее время ведется работа над оптимизацией их множества семантически близких поисковых запросов.

использования в качестве источника данных, а также Представляется, что продолжение работы в данном на преобразования их структуры в наиболее соответ правлении позволит расширить множество анализируе ствующую разрабатываемой математической модели.

мых вопросов, повысить качество анализа при помощи дополнительных критериев, а также построить систему Заключение семантически-ориентированного анализа естественно Предлагаемый подход не только решает про- языковых вопросов, позволяющую значительно повы блемы традиционных поисковых систем, но и по- сить семантическую релевантность результатов работы зволяет расширить возможности семантического традиционных систем поиска по ключевым словам.

Литература 1. Фомичев, В. 2005. Формализация проектирования лингвистических процессоров. МАКС Пресс. Москва.

2. Кириллов, А. 2009. Поисковые системы: компоненты, логика и методы ранжирования. Бизнес информатика № 4(10). C. 51—59. Москва.

3. Halpin, H and Lavrenko, V. 2009. Relevance Feedback Between Hypertext and Semantic Search. Proc.

Conference WWW2009 (April 20-24, 2009, Madrid, Spain).

4. Meij, E, Mika, P and Zaragoza, H. 2009. Investigating the Demand Side of Semantic Search through Query Log Analysis. Proc. Conference WWW2009 (April 20-24, 2009, Madrid, Spain).

5. Fernandez, M and Lopez, V. 2009. Using TREC for cross-comparison between classic IR and ontology-based search models at a Web scale. Proc. Conference WWW2009 (April 20-24, 2009, Madrid, Spain).

6. Dali, L, Rusu, D and Fortuna, B. 2009. Question Answering Based on Semantic Graphs. Proc. Conference WWW2009 (April 20-24, 2009, Madrid, Spain).

7. Akbik, A and Broth, J. 2009. Wanderlust: Extracting Semantic relations from Natural Language Text Using Dependency Grammar Patterns. Proc. Conference WWW2009 (April 20-24, 2009, Madrid, Spain).

8. Fomichov, V. 2010. Semantics-Oriented Natural Language Processing: Mathematical Models and Algorithms.

Springer: New York, Dordrecht, Heidelberg, London.

9. Zesch, T, M ller, C and Gurevych, I. 2008. Extracting Lexical Semantic Knowledge from Wikipedia and Wiktionary. Proc. Conference LREC 2008 (Marrakech, Morocco).

10. Fellbaum, C and Miller, G. 1998. WordNet. An electronic lexical database. Cambridge, MA: MIT Press;

1998. 422 p.

БИЗНЕС-ИНФОРМАТИКА №1(15)–2011 г.




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.