تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و Wavelet

دسته بندي : کالاهای دیجیتال » رشته برق و مخابرات (آموزش_و_پژوهش)

فرمت فایل:PDF

تعداد صفحه:101

فهرست مطالب :

چکیده................................................................ 1
مقدمه...................................................... 2
فصل اول: مفاهیم اولیه..................................... 4
1-1 مقدمه......................................................... 5
2-1 سامانه گویش انسان و مدل تولید گفتار.......................... 5
3-1 آواهاي زبان فارسی.................................................. 8
1-3- آواهاي واكدار و آواهاي بیواك.............................................. 9 1
2-3- همخوان و واکه............................................................ 9 1
3-3- واج و واجگونه.............................................................. 9 1
4-3- هجا در زبان فارسی........................................................... 9 1
4- مشخصههاي نواي گفتاري................................................... 10 1
1- زیر و بمی........................................................... 12 4-1
الف) آهنگ....................................................................... 12
ب) نواخت................................................................... 12
ج) تکیه............................................................................ 12
2- کشش.............................................................. 12 4-1
3- شدت.............................................................. 13 4-1
فصل دوم: تقطیع سیگنال صحبت............................ 14
1- مقدمه.......................................................................... 15 2
2- آشکارسازي قطعات واكدار، بیواك و سکوت................................... 15 2
3-2 تعیین فرکانس فرمنت و گام......................................... 19
4-2 قطعهبندي رویدادها................................................................. 21
1- قطعهبندي بر اساس تغییرات وابستگی طیفی..................................... 21 4-2
2- قطعهبندي بر اساس تغییرات آکوستیکی............................................... 23 4-2
3- قطعهبندي بر اساس تغییرات دامنه و فرکانس فرمنتها.................... 32 4-2
5- تعیین مرز اصوات انفجاري غیر واكدار..................................................... 33 2
فصل سوم: تبدیل ویولت.......................................... 35
1-3 مقدمه................................................................ 36
37......................................... STFT و FT 2- مقایسه تبدیل ویولت با 3
3- تنوع روشهاي پیادهسازي تحلیل ویولت.......................... 39 3
الف) تبدیل ویولت پیوسته.................................................... 39
ب) تبدیل ویولت گسسته................................................................... 41
42.............(Mallat 4- پیادهسازي تبدیل ویولت گسسته توسط فیلتر کردن مرحلهاي (الگوریتم 3
5- تنوع توابع ویولت.................................................................. 45 3
فصل چهارم: شبکه عصبی........................................................... 50
1-4 مقدمه...................................................................... 51
2-4 ساختار مغز انسان.............................................. 51
3-4 شبکه عصبی چیست؟........................................................ 53
4-4 طبقهبندي الگوها................................................................ 54
5-4 یادگیري و تعمیم.......................................................... 56
6-4 مدلسازي نرون تنها و اجزاي آن.................................. 56
7-4 انواع شبکههاي عصبی مصنوعی از نظر برگشتپذیري................................ 62
1-7-4 شبکههاي پیشخور....................................................... 62
2-7-4 شبکههاي پسخور برگشتی.................................... 62
63.....................................................ART 8-4 معرفی شبکههاي
65...............................................................Fuzzy ART 9-4 شبکه
1-9-4 دریافت اطلاعات ورودي..................................................... 66
67..........................................Fuzzy ARTMAP 10-4 شبکه
فصل پنجم: پیادهسازي روش...................................................... 71
1-5 مقدمه.......................................................... 72
2-5 تقطیع سیگنال...................................................................... 72
3-5 استخراج مشخصهها جهت اعمال به شبکه عصبی.................................. 73
74...........................................................(ZCR) الف) نرخ عبور از صفر
ب) انرژي سیگنال............................................................................. 74
ج) مشخصههاي استخراج شده از ضرایب ویولت................................. 74
د) انرژي طیف فرکانسی سیگنال................................... 76
77.........Fuzzy ARTMAP 4-5 برچسب زدن قطعات همخوان با استفاده از شبکه عصبی
فصل ششم: نتیجهگیري و پیشنهادات.......................................... 79
1-6 نتیجهگیري......................................................... 80
2-6 پیشنهادات................................................. 83
منابع و ماخذ............................................................. 84
فهرست منابع فارسی..................................................... 84
فهرست منابع لاتین.............................................................. 85
87.................................................................ABSTRACT

چکیده :

یکی از کاربردهاي نیازمند پردازش صحبت، تشخیص یا بازشناسی صحبت است. سامانه هاي تشخیص صحبت، دربرگیرنده محدوده وسیعی از کاربردها در سامانه هاي آموزشی، سامانه هاي پردازش واژه، کنترل کامپیوترها بوسیله صحبت و به طور خاص، سامانه هاي کنترلی براي افراد نابینا و معلول حرکتی هستند. در این میان، شناسایی واج هاي همخوان در یک سیگنال صحبت، به دلیل طبیعت ناپایدار، نامتناوب و نامنظم شان، همواره امري پیچیده بوده است. هدف ما در این پروژه، تعیین محدوده قطعات همخوان و سکوت و طبقه بندي آنها در سیگنال صحبت با استفاده از روش ترکیبی تبدیل ویولت گسسته (DWT) و شبکه عصبی Fuzzy ARTMAP، میباشد. استفاده از تبدیل ویولت (موجک)، محاسبات را کاراتر، آسانتر و امکان انجام کاربردهاي بیدرنگ را فراهم می آورد. تبدیل ویولت به دلیل فراهم آوردن امکان تحلیل زمان – فرکانس و تحلیل چندتفکیکی براي پردازش سیگنال هاي ناپایدار، نظیر سیگنال صحبت، بسیار مناسب است. همچنین در این پروژه از شبکه عصبی Fuzzy ARTMAP به دلیل داشتن ساز و کار یادگیري سریع، پایدار و بازدهی بالا در کاربردهاي طبقه بندي (به دلیل استفاده از تئوري فازي) استفاده کرده ایم.

براي قطعه بندي سیگنال صحبت در مرتبه رویداد، از روش قطعه بندي اتوماتیک ارائه شده در مرجع استفاده شده است. در این روش، سه راهکار بر مبناي تغییرات آکوستیکی و طیفی سیگنال صحبت و نیز تغییرات بارز در داده هاي فرمنت، بکار گرفته شده اند. به این ترتیب، ابتدا سیگنال صحبت به سه دسته واكدار، بیواك و سکوت (V/U/S) طبقه بندي میشود. سپس با در نظر گرفتن همزمان تغییرات طیفی سیگنال در یک دوره کوتاه زمانی، تغییرات در دامنه و فرکانس فرمنتها و مشخصه هاي آکوستیکی، مرز میان رویدادها آشکارسازي میشود. در ادامه، با استفاده از تبدیل ویولت و یکسري تحلیل هاي زمانی و فرکانسی، مشخصه هاي مربوط به قطعات آشکارسازي شده سیگنال صحبت، استخراج میشود.

تبدیل فوریه معمولی، اطلاعات لحظه اي و گذراي سیگنال صحبت را از بین میبرد. همچنین تبدیل فوریه زمان کوتاه (STFT)، گرچه امکان تحلیل همزمان بهتري را در حوزه زمان – فرکانس فراهم می آورد، اما به علت عدم قابلیت تفکیک پذیري متغیر در حوزه زمان – فرکانس، اغلب براي تحلیل سیگنالهاي صحبت، مناسب نمیباشد. تبدیل ویولت به دلیل دارا بودن قابلیت تفکیک پذیري متغیر، از پنجره هاي کوتاه در زمان (گسترده در فرکانس)، جهت بررسی رفتار گذراي سیگنال و از پنجره هاي بزرگ در زمان (متمرکز در فرکانس)، براي بررسی رفتار دراز مدت سیگنال، استفاده میکند. به همین خاطر، تبدیل ویولت، ابزاري نیرومند جهت تحلیل سیگنال هاي غیر ایستایی نظیر سیگنال صحبت محسوب میشود. در این پروژه، براي تعیین محدوده همخوان ها و سکوت و نیز استخراج مشخصه هاي آنها از ترکیب تحلیلهاي زمانی و فرکانسی و نیز براي طبقه بندي آنها از شبکه عصبی Fuzzy ARTMAP استفاده شده است.

در فصل اول، به معرفی مفاهیم اولیه اي چون سامانه گویش انسان، مدل تولید گفتار، آواهاي زبان فارسی و مشخصه هاي نواي گفتار پرداخته میشود. فصل دوم به موضوع تقطیع سیگنال صحبت پرداخته است. در این فصل، روش بکار گرفته شده جهت آشکارسازي رویدادها در یک سیگنال صحبت و تعیین مرز میان قطعات، شرح داده میشود. در فصل سوم، اطلاعاتی پیرامون تبدیل ویولت، مقایسۀ آن با FT و STFT و روشهاي پیاده سازي تحلیل ویولت آورده شده است. فصل چهارم به موضوع شبکه عصبی اختصاص داده شده است. در این فصل، مفاهیم اولیه شبکه هاي عصبی، انواع شبکه هاي عصبی مصنوعی از نظر برگشت پذیري، شبکه ART، شبکه عصبی Fuzzy ART و شبکه عصبی Fuzzy ARTMAP مورد بحث قرار گرفته است. در فصل پنجم، تشریح روند انجام این پروژه و چگونگی بکارگیري امکانات و مفاهیم معرفی شده در فصل هاي پیشین براي رسیدن به اهداف مورد نظر، گنجانده شده است. فصل ششم نیز در برگیرنده نتایج و پیشنهادات حاصل از انجام این پروژه است.

و...

 

دسته بندی: کالاهای دیجیتال » رشته برق و مخابرات (آموزش_و_پژوهش)

تعداد مشاهده: 3025 مشاهده

فرمت فایل دانلودی:.zip

فرمت فایل اصلی: pdf

تعداد صفحات: 101

حجم فایل:2,386 کیلوبایت

 قیمت: 65,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل