WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 75 | 76 || 78 | 79 |   ...   | 82 |

В работе используются результаты фонетических и морфологических свойств и характеристик для анализа украинской речи.

332 Intelligent Systems Объектом синтеза будем рассматривать слово в связи с тем, что в описанной задаче озвучивания произвольной текстовой (словесной) информации минимальным семантически полным носителем информации является именно слово. Это подсказывают и результаты фонетических исследований [Кривонос, 2006].

Акустические характеристики гласных слова и соотношение гласных под ударением и безударных значительно отличается от соответствующих показателей слов изолированных. Поэтому следует дифференцировать ударение организованное изолированным словом, и ударение слова в предложении, т.е. фразовое ударение [Ющук, 2004].

В данной работе предлагается общая структура представления объектов синтеза, их свойств и характеристик.

1. Общие грамматические характеристики слова, отображающие правила его написания и пр.

2. Наборы гласных, согласных, йотированных, смягченных звуков, мягких знаков, апострофов и их количество, соответствующие слову. Эти характеристики позволят описать (а при построении модели синтеза и использовать) фонетические свойства звуков речи. Так, известно, что:

– произношение гласных зависит, прежде всего, от позиции в слове и их артикуляционных характеристик и в незначительной мере от соседства с теми или другими согласными звуками;

– произношение согласных зависит от звукового окружения и предопределяется их артикуляционными характеристиками.

4. Набор элементов синтеза составляющих слово. Это могут быть как «классические» элементы синтеза (фоны, слоги, дифоны, трифоны), так и какие-то другие, выбранные специально для конкретной системы озвучивания. Элементы синтеза, в свою очередь, обладают рядом свойств и характеристик, которые будут рассмотрены далее.

5. Набор времени звучания элементов синтеза и общее время звучания слова. В естественной речи каждое слово и его составляющие (в задаче синтеза речи это элементы синтеза) имеют строго определенное время звучания и для естественности звучания это следует учитывать.

6. Набор звуковых файлов определенного размера содержащих элементы синтеза. Выделение и использование данных сведений направлено на анализ и оптимизацию работы с оцифрованными звуковыми речевыми сигналами, возможностью упрощения их перекодирования в разные цифровые форматы звуковых данных.

7. Частотные характеристики использования слова в речи и частотные характеристики элементов синтеза для данного слова.

Существует несколько стандартных подходов к выбору концепции формирования элементов синтеза:

выбор фонов, дифонов, слогов и трифонов.

Поскольку в естественной речи не все звуки являются вокализированными, то часто используют гибридный дифонно-силябулярный конкатенативный синтез, где часть элементов является дифонами, а часть – слогами [Hess, 1992].

Для конкатенативных систем с практически всеми (кроме фонов) фонетическими единицами в качестве минимальных элементов синтеза характерно присутствие «вспомогательных» единиц, таких как начальные и завершительные полуфоны – акустические эквиваленты начальных и завершительных частиц фонем.

Таким образом, выбор элементов синтеза представляет собой сложную задачу, требующую тщательных языковедческих исследований. Так, следует учитывать большое количество фонетических коартикуляционных свойств элементов речи (следовательно, элементов синтеза речи), в частности таких как:

– произношение гласных в зависимости от их расположения в слове;

– ударение гласных;

– акустические особенности и характеристики гласных изолированных, в слове и в предложении;

– произношение согласных в зависимости от их расположения в слове, смягчение, удвоение и пр.;

– влияние акцентированности и ударения на частотные характеристики речи;

– движение и характеристики частоты основного тона;

– суперсегментные явления;

XII-th International Conference "Knowledge - Dialogue - Solution" – структуризацию пары «объект синтеза – элемент синтеза»;

– просодию, средства просодии и просодические характеристики;

– интонационные свойства естественной речи9 и пр.;

Для учета выше перечисленных свойств в данной работе предлагается следующее общее структурное представление элемента синтеза как составляющего системы озвучивания речи.

1. Текстовый вид элемента синтеза – совокупность текстовых элементов синтеза (это могут быть фонемы, дифоны, слоги, трифоны и пр.) должна формировать полную выборку слов [Кривонос, 2005].

3. Цифровой звуковой сигнал, содержащий элемент синтеза. Записанную звуковую информацию следует хранить с высоким качеством в удобном для последующей обработки формате цифровых звуковых данных. Также необходимо провести фильтрацию избыточной информации сигналов и нормализацию звуковых элементов синтеза. Это принципиально повысит качество естественности звучания и разборчивость синтезируемой речи.

4. Тип элементов синтеза. Согласно предварительным фонетическим и морфологическим исследованиям, необходимо провести строгую типизацию элементов синтеза по таким характеристикам:

– расположение в слове;

– ударность / безударность гласного звука элемента (если присутствует);

– свойства согласного звука элемента (если присутствует);

– сегментные свойства согласных и пр.

5. Время звучания элемента синтеза. На этапах создании и использовании звуковых элементов синтеза следует учитывать время звучания элемента при произношении их диктором в естественных условиях.

6. Звуковой файл, содержащий элемент синтеза. Выделение и использование данных сведений направлено на создание статистических данных о конкретном элементе и базы всех элементов синтеза.

7. Фонетические, морфологические и акустические сведения об элементах синтеза.

Особое внимание следует уделить исследованиям фонетических, морфологических, коартикуляционных, интонационных, просодических свойств речи для их использования при построении систем озвучивания информации.

Заключение Рассмотрена задача создания систем озвучивания информации, поданной в текстовом виде – посредством конкатенативного Text-to-Speech синтеза. Для этого выполнен обзор основных этапов проблемы, выделение и анализ основных подзадач. Описаны особенности такого подхода относительно решения проблемы – простота концепции, высокий уровень естественности звучания синтезированной речи, высокая скорость работы систем конкатенативного синтеза. Исследованы фонетические свойства и характеристики синтезируемой речи. Предложено структурное представление объектов и элементов синтеза. Проведен анализ их структуры, свойств и характеристик. Акцентирована необходимость анализа интонационных и просодических характеристик украинской речи для задачи синтеза речи. Уделено внимание большому количеству проблем, связанных с фонетическими коартикуляционными свойствами элементов речи.

Библиография [Dutoit, 1993] Dutoit and Leich H. MBR-PSOLA: Text-to-speech synthesis based on an MBE re-synthesis of the segments database // Speech Communication. – [Cox, 2000] Cox R.V., Kamm C.A., Rabiner L.R., Schroeter J. Wilponl J.G. Speech and language processing for next-millennium communications services // Proc. Of the IEEE. – 2000. – 88, N. 8.

[Hess, 1992] Wolfgang Hess Speech synthesis – a solved problem // Signal Processing VI. – 1992. – P. 37–46.

[W3C] http://www.xmlhack.ru/articles/03/02/05/vxml20.html Теоретическое и практическое значения интонации как формулирующего элемента и структурного компонента звуковой речи является очень важным. Интонацию определяют как «фразовую фонетику», «синтаксическую фонетику», как суперсегментный уровень речи; менее распространенным есть ее определение как ритмомелодики и просодии [Багмут, 2004].

334 Intelligent Systems [Багмут, 2004] Багмут А. Українська інтонологія: проблематика досліджень // Українське мовознавство – К.: Національний університет імені Тараса Шевченка, 2004. № 32–33. – С. 36–[Крак, 2005] Крак Ю.В., Шатковський М.М. Сегментація мовної інформації для задач автоматичного озвучення // Вісн.

Київськ. ун-ту. Сер. фіз.-мат. наук. – К.: Національний університет імені Тараса Шевченка, 2005 – Вип. 4. – С. 254-258.

[Кривонос, 2005] Кривонос Ю.Г., Крак Ю.В., Шатковский Н.Н. Анализ структуры задачи создания систем озвучивания текстовой информации // Компьютерная математика, 2005. – № 3. – С. 87–[Кривонос, 2006] Кривонос Ю.Г., Крак Ю.В., Шатковский Н.Н. Структура, свойства, характеристики объектов и элементов синтеза речи // Компьютерная математика, 2006. – № 1. – С. 61–[Ющук, 2004] Ющук І. Фонетичні закони й орфоепія // Українське мовознавство. – К.: Національний університет імені Тараса Шевченка, 2004. № 32–33. – С. 16–Информация об авторах Кривонос Ю.Г. – Институт кибернетики В.М.Глушкова НАН Украины, зам. директора, 40, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: aik@public.icyb.kiev.ua Крак Ю.В. – Национальный университет имени Тараса Шевченко, профессор, 6, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: krak@unicyb.kiev.ua Шатковский Н.Н. – Институт кибернетики В.М.Глушкова НАН Украины, м.н.с., 40, пр-кт Академика Глушкова Киев-03187, Украина, e-mail: nicolo@icyb.kiev.ua FINDING OF INFORMATIVE PARAMETERS DESCRIBING BIOMEDICAL POPULATIONS Mykola Budnyk, Igor Voytovych Abstract: Problem of classification one population onto two classes is often used in biological and medical studies. Approach for searching of informative (valuable) parameter, based on integral probability distribution function, has been proposed. It was shown that binary (threshold) decision rules could be generalized by involving of risk zone. Examples of processing of empirical data for clinical group including healthy persons and patients with coronary artery disease, observed by method of magnetocardiography, were presented.

Keywords: diagnostic test, generalized parameters, binary decision rule, risk zone, fuzzy logic.

ACM Classification Keywords: G.3 Mathematics of Computing – Probability and statistics, J.3 Computer Applications – Life and medical sciences.

Introduction Problem of classification of given subject from biological or medical (BioMed) population onto two classes is part of more general problem of Decision Making (DM). This is the simplest example of minimal number of groups.

Solution of this problem within particular application area consists in synthesis of appropriate Decision Making Algorithm (DMA). Specific features of BioMed (more generally – living) population is that it is formed by elements of statistical nature. Therefore, characteristics of probability distribution function (PDF) with respect to any experimentally observed parameter are essentially influenced by many another external non-informative factors.

As a result, wide blurring, asymmetry, excess, up to non-unimodal form, i.e. differences of empirical PDF from gauss-like form are take place. All that do generating of reliable BioMed DMAs are very difficult, because above factors are, in fact, the disturbed degree of freedom which are equivalent to strong external noises in physical sciences.

XII-th International Conference "Knowledge - Dialogue - Solution" The quality of group discrimination is determined primarily by the quality of describing parameters. Therefore, the search for informative (diagnostically significant) parameters, i.e. identification of populations, is crucial. Basic hazards, for instance, of ischemic heart disease (IHD), are posed by sex, age, genetic factor, hypercholesterolemia, arterial hypertension, smoking habits, excessive body weight, and inactive lifestyles. They may cause directed effect that shifts informative parameter towards IHD, which ultimately will bring about asymmetry in PDF.

Other PDF’s deviations from Gauss form may also be caused by “uncompensated” impact of external factors.

1. Figures of Merit (FOM) of Medical Test Diagnostic value is determined generally by such 4 indicators as Specificity (Sp), Sensitivity (Sn), Negative prognostic value (NPV), Positive prognostic value (PPV), yet depending on applications (screening, diagnosing or evaluation of treatment effectiveness) a certain index is decisive. Here is considered the simplest and the most practiced case of the one-dimensional parametric (sample) space when division is made with just a single parameter, and the simplest threshold Decision Rule (DR) dividing a group by two - negative and positive classes - depending on the side of a critical value (threshold) which the patient’s parameter takes. Here occur the errors of the first kind (missing a target – false negative (FN), ) and second kind (false alarm – false positive (FP), ).

Negative class, if Х < (>) Х CR Binary DR (X )= (1) CR Positive class, if Х> (<) Х CR Assume the objective is to divide a group of persons consisting of samples of healthy individuals N in number A and patients N in number by two – positive and negative classes. Use of threshold DR thus resulted in а(b) true B negative (TN) and true positive (TP) persons and c(d) of FN(FP). Therefore, N =b+c, N =a+d and all probabilities B A are normalized by the total N=N +N. The respective FOMs are as follows:

A B Sp=1–, Sn=1–, =d/ N, =c/ N, NPV=С/(С+n), PPV=Ч/(Ч+/n), n=p/(1–p), p=N /N. (2) A B B Sn and Sp demonstrate a probability of attributing persons to a “true” class, i.e. healthy individuals to class 1 and patients to class 2; they require a priori knowledge of groups and, consequently, are the indicators of value of the direct discrimination problem solution (DPS) i.e. the quality of training. NPV and PPV demonstrate a probability that persons attributed to a certain class comprise the “true” group, i.e. class 1 to healthy individuals and class to patients and require a posteriori probability of a correct classification; they are thus the indicators of the value of inverse DPS, i.e. the quality of an exam.

From (2) it is seen a major failure of inverse DPS by means of classic Bayesian approach being a dependence of prognostics on the prevalence p(2) which is in essence a proportion of a number of persons (a priori probabilities) in training groups n=N /N. Although, both in an exam mode (so called a “blind test”) and in an operational mode B A there is no a priori information in principle.

Pages:     | 1 |   ...   | 75 | 76 || 78 | 79 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.