Добро пожаловать!

Pages:     ||

http://pierre.senellart.com/publications/ollivier2006finding.pdf [146]. Pantel P., Lin D. Word-for-word glossing with contextually similar words. In Proceedings of ANLP-NAACL 2000. Seattle, Washington, May, 2000. – pp. 75-http://www.cs.ualberta.ca/~lindek/papers.htm [147]. Pedersen T. Computational approaches to measuring the similarity of short contexts: a review of applications and methods. – South Asian Language Review (to appear), 2008. – Vol. 1, No. 1. http://arxiv.org/abs/0806.[148]. Pedersen T., Pakhomov S., Patwardhan S., Chute C. Measures of semantic similarity and relatedness in the biomedical domain. – Journal of Biomedical Informatics, 2007. – Vol. 40, No. 3, pp. 288-299. http://www.d.umn.edu/~tpederse/ Pubs/jbi2007.pdf [149]. Ponzetto S. P., Strube M. An API for measuring the relatedness of words in Wikipedia. In Companion Volume to the Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics. Prague, Czech Republic, 23-June, 2007. http://www.eml-research.de/english/homes/ponzetto/pubs/acl07.pdf [150]. Ponzetto S., Strube M. Exploiting semantic role labeling, WordNet and Wikipedia for coreference resolution. In Proceedings of the Human Language - 171 Technology Conference of the North American Chapter or the Associaton for Computational Linguistics (HLT-NAACL 06). New York City, N.Y., June 4-9, 2006. – pp. 192-199 http://www.emlresearch.de/english/research/nlp/publications.php [151]. Resnik P. Disambiguating noun groupings with respect to WordNet senses. In Proceedings of the 3rd Workshop on Very Large Corpora. MIT, June, 1995. http:// xxx.lanl.gov/abs/cmp-lg/[152]. Resnik P. Semantic similarity in a taxonomy: an information-based measure and its application to problems of ambiguity in natural language. – Journal of Artificial Intelligence Research (JAIR), 1999. – Vol. 11, No., pp. 95-130.

http://www.cs.washington.edu/research/jair/abstracts/resnik99a.html [153]. Resnik P., Yarowsky D. Distinguishing systems and distinguishing senses: new evaluation methods for word sense disambiguation. – Natural Language Engineering, 2000. – Vol. 5, No. 2, pp. 113-133.

http://www.cs.jhu.edu/~yarowsky/pubs.html [154]. Rigau G., Atserias J., Agirre E. Combining unsupervised lexical knowledge methods for word sense disambiguation. In Proceedings of joint 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics ACL/EACL'97, Madrid, Spain, 1997.

http://www.lsi.upc.es/~nlp/papers/1997/acl97-raa.ps.gz [155]. Robertson S. Understanding inverse document frequency: on theoretical arguments for IDF. – Journal of Documentation, 2004. – Vol. 60, No., pp.

503-520. http://www.soi.city.ac.uk/~ser/idfpapers/Robertson_idf_JDoc.pdf [156]. Robertson S., Zaragoza H. On rank-based effectiveness measures and optimization. – Information Retrieval, 2007. – Vol. 10, No., pp. 321-339.

http://www.soi.city.ac.uk/~ser/papers/new_optimisation_final.pdf [157]. Rosenzweig R. Can history be open source Wikipedia and the future of the past.

– The Journal of American History, 2006. – Vol. 93, No. 1, pp. 17-46.

http://chnm.gmu.edu/resources/essays/d/[158]. Ruiz-Casado M., Alfonseca E., Castells P. Automatic assignment of Wikipedia encyclopedic entries to WordNet synsets. 2005.

http://arantxa.ii.uam.es/~castells/publications/awic05.pdf - 172 [159]. Sahami M., Heilman T. D. A web-based kernel function for measuring the similarity of short text snippets. In Proceedings of the 15th International World Wide Web Conference (WWW), 2006.

http://robotics.stanford.edu/users/sahami/papers-dir/www2006.pdf [160]. Schmitz C., Hotho A., Jschke R., Stumme G. Mining association rules in folksonomies. In Proc. IFCS 2006 Conference. Ljubljana, July, 2006. – pp.

261-270 http://www.kde.cs.unikassel.de/hotho/pub/2006/schmitz2006asso_ifcs.pdf [161]. Schone P. Toward knowledge-free induction of machine-readable dictionaries.

Ph.D., University of Colorado at Boulder, 2001.

http://hometown.aol.com/boisebound/family/publications/DPFV.pdf.gz [162]. Serrano M.A., Maguitman A., Boguna M., Fortunato S., Vespignani A. Decoding the structure of the WWW: facts versus sampling biases. 2006. http://arxiv.org/abs/ cs/[163]. Shi Z., Gu B., Popowich F., Sarkar A. Synonym-based expansion and boostingbased re-ranking: a two-phase approach for genomic information retrieval. Simon Fraser University, 2005. http://trec.nist.gov/pubs/trec14/t14_proceedings.html [164]. Shvaiko P., Euzenat J. A Survey of schema-based matching approaches. Journal on Data Semantics, 2005. http://www.ontologymatching.org [165]. Sima J., Schaeffer S.E. On the NP-completeness of some graph cluster measures.

2005. http://arxiv.org/abs/cs/[166]. Sinha R., Mihalcea R. Unsupervised graph-based word sense disambiguation using measures of word semantic similarity. In Proceedings of the IEEE International Conference on Semantic Computing (ICSC). Irvine, CA, September, 2007. http://www.cs.unt.edu/~rada/papers/mihalcea.naacl07.pdf [167]. Smirnov A., Krizhanovsky A. Information filtering based on wiki index database.

In Proceedings of the 8th International FLINS Conference on Computational Intelligence in Decision and Control. Spain, Madrid, September 21 – 24, 2008.

http://arxiv.org/abs/0804.[168]. Smirnov A., Krizhanovsky A., Roy R., Kerr C. A multi-agent system architecture for requirements management in the extended enterprise. In Proceedings of CE2004: 11th ISPE International Conference on Concurrent Engineering, Research and Applications, Beijing, China, July, 2004. – pp. 235-http://whinger.narod.ru/paper/index.html - 173 [169]. Smirnov A., Levashova T., Pashkin M., Chilov N., Krizhanovsky A., Kashevnik A., Komarova A. Context-sensitive access to e-document corpus // Труды международной конференции «Корпусная лингвистика–2006». – СПб.:

Изд-во С.-Петерб. ун-та, 2006. – C. 360-364. http://arxiv.org/abs/cs/[170]. Smirnov A., Pashkin M., Chilov N., Levashova T., Krizhanovsky A. High-level business intelligence service in networked organizations. In Abstracts of eBusiness Research Forum eBRF 2003. Tampere, Finland, 2003. – pp. 37-[171]. Smirnov A., Pashkin M., Chilov N., Levashova T., Krizhanovsky A. Free text user request processing in the system “KSNet”. In Proceedings of the 9th International Conference “Speech and Computer”. St.Petersburg, Russia, 2004. – pp. 662-[172]. Smirnov A., Pashkin M., Chilov N., Levashova T., Krizhanovsky A., Kashevnik A. Ontology-based users and requests clustering in customer service management system. In (Gorodetsky, V., Liu, J., Skormin, V., eds.) Autonomous Intelligent Systems: Agents and Data Mining: International Workshop, AIS-ADM 2005. Springer-Verlag GmbH, Lecture Notes in Computer Science, Vol. 3505, 2005. – pp. 231-246 http://arxiv.org/abs/cs.IR/[173]. Strube M., Ponzetto S. WikiRelate! Computing semantic relatedness using Wikipedia. In Proceedings of the 21st National Conference on Artificial Intelligence (AAAI 06). Boston, Mass., July 16-20, 2006. http://www.emlresearch.de/english/research/nlp/publications.php [174]. Survey of text mining: clustering, classification, and retrieval, M. Berry (Ed.). – Springer-Verlag, New York, 2003. – 244 pp. – ISBN 0-387-955631.

[175]. Teich E., Fankhauser P. WordNet for lexical cohesion analysis. In Proceedings of the Second Global WordNet Conference. Brno, Czech Republic, January 20-23, 2004. – pp. 326-331 http://www.fi.muni.cz/gwc2004/proc/77.pdf [176]. Thom J. A., Pehcevski J., Vercoustre A.-M. Use of Wikipedia categories in entity ranking. In 12th Australasian Document Computing Symposium (ADCS'07), 2007.

http://arxiv.org/abs/0711.[177]. Turney P.D. Mining the Web for synonyms: PMI-IR versus LSA on TOEFL. In Proceedings of the Twelfth European Conference on Machine Learning (ECML-2001). Freiburg, Germany, 2001. – pp. 491-502 http://arxiv.org/abs/cs.LG/ - 174 [178]. Turney P.D. Expressing implicit semantic relations without supervision. In Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics (ACL-06). Sydney, Australia, 2006. – pp. 313-320 http://arxiv.org/abs/cs/[179]. Turney P.D. Similarity of semantic relations. – Computational Linguistics, 2006.

– Vol. 32, No. 3, pp. 379-416. http://arxiv.org/abs/cs/[180]. Turney P.D., Littman M.L., Bigham J., Shnayder V. Combining independent modules to solve multiple-choice synonym and analogy problems. In Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP-03). Borovets, Bulgaria, 2003. – pp. 482-http://arxiv.org/abs/cs.CL/[181]. Uschold M., Gruninger M. Ontologies: principles, methods, and applications. – Knowledge Engineering Review, 1996. – Vol. 11, No. 2, pp. 93-155.

http://citeseer.ist.psu.edu/uschold96ontologie.html [182]. Vercoustre A.-M., Thom J. A., Pehcevski J. Entity ranking in Wikipedia. In Proceedings of the 23rd Annual ACM Symposium on Applied Computing (SAC08), 2008. http://arxiv.org/abs/0711.[183]. Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantic Wikipedia.

In Proceedings of the 15th International Conference on World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Scotland, May 23 - 26, 2006. – pp.

585-594 http://www2006.org/programme/item.phpid=[184]. Voss J. Collaborative thesaurus tagging the wikipedia way. Collaborative Web Tagging Workshop. 2006. http://arxiv.org/abs/cs/[185]. Widdows D. and Dorow B. A graph model for unsupervised lexical acquisition.

In 19th International Conference on Computational Linguistics.Taipei, 2002. – pp.

1093-1099 http://infomap.stanford.edu/graphs/ [186]. Wu Z., Palmer M. Verb semantics and lexical selection. In Proc. of ACL-94, 1994. – pp. 133-138 http://acl.ldc.upenn.edu/P/P94/P94-1019.pdf [187]. Yarowsky D. Unsupervised word sense disambiguation rivaling supervised methods. In Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics. Cambridge, MA, 1995. – pp. 189-http://www.cs.jhu.edu/~yarowsky/pubs.html [188]. Zaidman A., Rompaey B., Demeyer S., Deursen A. On how developers test open source software systems. 2007. http://arxiv.org/abs/0705.- 175 [189]. Zesch T., Mueller C., Gurevych I. Extracting lexical semantic knowledge from Wikipedia and Wiktionary. In Proceedings of the Conference on Language Resources and Evaluation (LREC), 2008. http://elara.tk.informatik.tudarmstadt.de/publications/2008/lrec08_camera_ready.pdf [190]. Zhdanova A., Shvaiko P. Community-driven ontology matching. In Proceedings of ESWC'06, LNCS 4011, 2006. – pp. 34-http://dit.unitn.it/~knowdive/index.phpidx=pubs - 176 Приложение 1. Список наиболее употребительных сокращений АОТ – автоматическое обработка текста БД – база данных ВП – Википедия ИПС – информационно-поисковая система ПО – предметная область СБС – семантически близкие слова AHITS – Adapted Hyperlink-Induced Topic Selection IE – Information Extraction SEW – Simple English Wikipedia RW – Russian Wikipedia WSD – Word Sense Disambiguation - 177 Приложение 2. Акты внедрения - 178 - 179 - 180 Приложение 3. Экспериментальные данные программы Synarcher Полный список семантически близких слов, построенный программой Synarcher представлен в табл. 1. Поиск выполнялся при следующих параметрах:

• размер корневого набора:200;

• инкремент:17;

• чёрный список категорий:Страны|Века|Календарь| География_России|Люди;

• ограничение сверху длины строящегося списка слов:100;

• погрешность для останова итераций: 0.01.

Таблица Полный список1 семантически близких слов, построенный программой Synarcher Жаргон Слово|Арго|Матерщина|Эвфемизм|Просторечие|ЗЫ|Ака|Диалектология|Сленг|Франц.| Аниме ИстинаФилософия|Религия|Математика|Христианство|Искусство|Физика|Логика|Теология| Химия|Биология|История|Медицина|Натурфилософия|Мифология|Идеология|Экономика| Механика|Теория|Психология|Филология|Мировоззрение|Современность|Постмодерн| Мистицизм|Вселенная|Викиновости|США|Диалектика|Астрономия|Космология|Гипотеза| Право|Демокрит|Социология|Информатика|Магия|Гносеология|Астрофизика|Космогония| Богословие|Космос|Эмпиризм|Атом|Экология|Абстракция|Агностицизм|Алгебра| Лингвистика|Схоластика|Мораль|Дедукция|Образование|Эксперимент|Антропология| Средневековье|Каббала|Материаловедение|Техника|Язык|Гравитация|Хаос|Геометрия| Криптография|Геология|СССР|Звезда|Оптика|Алхимия|Лженаука|Кибернетика| Архитектура|Электрон|Астрология|Иммунология|Фрактал|Пространство-время| Псевдонаука|Возрождение|Марксизм-ленинизм|Индукция|Космонавтика|Робототехника| Галактика|Нейтрон|Бионика|Парапсихология|Политология|Радиоактивность|Технология| ДНК|Электротехника|Компьютер|Полупроводник|Нумерология|Электроника| Портал:Наука|Культурология|Нанотехнология|Шизофрения|Свет Самолёт Вертолёт|Аэростат|Планер|Мускулолёт|Автожир|Винтокрыл|Турболёт|Экраноплан| 1 Полный список, то есть без фильтрации экспертом 2 Использовалась программа Synarcher версии 0.12.- 181 Махолёт|Экранолёт|Викисклад|Авиация|Атмосфера|Воздух|Водород|Винт|СССР|Гелий| США|Газ|Аэропорт|Фарнборо|Пулемёт|DARPA|Давление|Сибирь|Радио|Киловатт| Движитель|А-50|Дирижабль|Шарльер|Монгольфьер|Велосипед|Двигатель|Конвертоплан| Педаль|ОКБ|Вектор|Тангаж|Крен|Пожар|Артиллерия|Эверест|Фенестрон|Спецназ| Разведка|Медицина|Ка-50|Москва|ИКАО|Феодосия|Boeing|Ан-225|Мореходность| Каспийск|ИМО|Амфибия|Дельтаплан|Параплан|Катапульта|Ива|Шёлк|Фюзеляж|ЛаМанш|Икар|Бензин|Инфраструктура|Скорость|Самолет|ПВО|Космонавтика|Керосин| Судно|Энергия|Гироскоп|Корабль|Техника Сюжет Философия|Наука|Искусство|Религия|История|Идеология|Бог|Христианство|Литература| Культура|Поэзия|Античность|Трагедия|Эпос|Илиада|Поэт|Одиссея|Символизм|Аллегория| Ирония|Общество|Мировоззрение|Драма|Католицизм|Фольклор|Романтизм|Личность| Грех|Гёте|Мистика|Символ|Человечество|Персонаж|Евангелие|Имя|Катастрофа| Фантастика|Пролетариат|Притча|Бессмертие|Эстетика|Познание|Абстракция| Викицитатник|Эмоция|Семиотика|Скульптура|Абстракционизм|Документ|Художник| Письменность|Цвет|Мифология|Натурфилософия|Образ|Реализм|Мотив|Интрига| Шекспир|Сатира|Сказка|Агиография|Проза|Антропоморфизм|Жанр|Метод|Автор|Текст| Знак|XVII|Миф|Событие|Атеизм|Аноним|Неоязычество|Викисклад|Живопись| Фотография|Кинематограф|Метафора|Реклама|Изображение|Орнамент|Герой|Ритм| Комедия|Кино|Драматургия|Шиллер|Трилогия|Басня|Компьютер|Минерал|Саундтрек| Баба-Яга - 182 Приложение 4. Упорядочение списков с помощью респондентов Задача упорядочения списка семантически близких слов была решена с помощью привлечения респондентов, носителей русского языка. Им был представлен список слов (графа «Слова» в табл.

Pages:     ||

© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.