12.07.2015 Views

دانلود - جام جم

دانلود - جام جم

دانلود - جام جم

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Infoدانشبررسي نرم افزار تشخيص هويتمن شما را مي شناسميكشنبه 15 آبان / 1390 شماره 353محمدعلي زارعي فرامروزه كمتر كسي است كه با تلفن هاي گويا آشنانباشد.‏ اگر شما با يك شركت تماس بگيريد،‏ معمولا بايداول به راهنمايي هاي يك صداي ضبط شده توجه كنيدو با فشار دادن دكمه هاي شماره گير به هدف خود برسيد.‏بسياري از اين شركت ها يك گام بيشتر نيز برداشته اندو به جاي فشار دادن دكمه مي توانيد كلمات خاصي رابگوييد تا همان فرمان ها اجرا شود.‏ اين كار به وسيلهيك سيستم تشخيص صوت ان<strong>جام</strong> مي شود و مي تواندكلمات و صدا ها را به صورت نوشته تبديل كند.‏شما حتي مي توانيد از نرم افزار هاي تشخيص صوتبراي كار هاي خانگي و تجاري نيز استفاده كنيد.‏ شمابا بعضي از نرم افزارها مي توانيد فرمان هاي خود رابه صورت صوتي به رايانه بگوييد يا به جاي تايپ كردندر نرم افزار ،word كلمات را با صدا به آن منتقلكنيد و اين نرم افزارها خود به خود حرف هاي شما رابه صورت نوشته تبديل مي كند.‏ شما حتي مي توانيد بااستفاده از آنها كارهاي عادي مانند باز كردن و بستنفايل ها را ان<strong>جام</strong> دهيد.‏ نرم افزار هايي در اين زمينه نيزوجود دارند كه براي يك هدف خاص مانند پزشكي يامباحث حقوقي ساخته شده اند.‏اين سيستم هاي تشخيص صوت به افرادي معلولو ناتوان نيز كمك زيادي مي كند.‏ براي مثال افراديكه به هر دليل نمي توانند تايپ كنند،‏ با استفاده از ايننرم افزارها مي توانند نيازهاي خود را برطرف كنند.‏ اينبرنامه ها 2 دسته مي شوند:‏‎1‎ برنامه هايي با لغت نامه كوچك اما كاربرانزياد.‏ اين سيستم ها براي استفاده در تلفن هاي گويامناسب است.‏ كاربران آن مي توانند با لهجه ها وگويش هاي مختلف با آن صحبت كنند و اين سيستم دربيشتر موارد كلمات را به صورت صحيح دريافت مي كند؛اما از طرفي ديگر ورودي ها و فراميني را كه دريافتمي كند محدود است.‏‎2‎ برنامه هايي با لغتنامه بزرگ اما كاربران محدود.‏اين سيستم ها براي محيط هاي تجاري كه كاربران كميبا آن سر و كار دارند،‏ مناسب است.‏ اين سيستم ها ضريبدقت بالايي دارند ‏(براي كاربران حرفه اي در حدود 85درصد)‏ و لغت نامه آنها از ده ها هزار كلمه تشكيل شدهاست و بايد آنها را به گونه اي تنظيم كنيد كه با تعدادمحدودي از كاربران به بهترين صورت كار كند.‏ دقتاين سيستم براي كاربران ديگر بشدت پايين مي آيد.‏برنامه هايتشخيص صداييكه در گذشتهوجود داشت،‏ درتشخيص <strong>جم</strong>لاتو كلمات پشتسر هم مشكلداشتند و بايدهر كلمه راجداگانه و بعداز يك وقفه،‏ كلمهبعدي را مي گفتيد.‏ امااكثر كاربران ترجيح مي دهند به صورت پيوسته و عاديحرف بزنند و امروزه تعداد قابل توجهي از سيستم هايتشخيص صوت از اين مورد پشتيباني مي كنند.‏براي تبديل گفته هاي يك كاربر به نوشته يافرمان هاي رايانه اي،‏ يك كامپيوتر بايد مراحل پيچيده ايرا طي كند.‏ وقتي صحبت مي كنيد در هوا ارتعاشبه وجود مي آيد.‏ تبديل كننده آنالوگ به ديجيتال(ADC) اين موج آنالوگ را به ديجيتال تبديل مي كندتا براي رايانه قابل پردازش باشد.‏ براي اين كار،‏ از صوتتوليد شده نمونه برداري مي كند و در بازه هاي متوالي موجرا بدقت اندازه گيري مي كند.‏ پس از آن،‏ سيستم صوتديجيتال شده را فيلتر مي كند تا اختلالات و نويزها رااز بين ببرد.‏ بعضي اوقات براي جدا كردن فركانس هايمختلف اين كار را ان<strong>جام</strong> مي دهد و بعد صداي توليد شدهرا به صورت استاندارد در مي آورد و درجه صدا را كم يازياد و آن را تنظيم مي كند.‏ از آنجا كه سرعت حرفزدن انسان هميشه يكسان نيست،‏ صداي ديجيتالتوليد شده در رايانه بايد با توجه به سرعت حرف زدن ونمونه گرفته شده از آن تنظيم شود.‏در مرحله بعد،‏ سيگنال توليد شده به بخش هايكوچك ‏(در حدود چند صدم يا هزارم ثانيه)‏ تقسيممي شود.‏ سپس اين بخش هاي كوچك توليد شدهبا واج هاي صوتي موجود در زبان تعيين شده مقايسهمي شوند.‏ واج،‏ كوچك ترين واحد يك زبان است كه ازبه هم پيوستن آنها يك عبارت با معني به وجود مي آيد.‏در زبان انگليسي تقريبا 40 واج وجود دارد.‏ ‏(زبان شناسانمختلف نظرات متفاوتي درباره تعداد واج ها دارند)‏مرحله بعد ساده به نظر مي آيد،‏ اما در واقع بسيارسخت است و هدف اكثر نرم افزارهاي تشخيص صوتمحسوب مي شود.‏ اين نرم افزار واج ها را در كنار واج هايديگر بررسي مي كند و با يك نمودار پيچيده آماري،‏كلمات،‏ عبارات و <strong>جم</strong>لات از پيش تعيين شده را مقايسهمي كند و بعد از به دست آوردن كلمات گفته شده،‏ آنها رايا به صورت نوشته نمايش مي دهد يا به صورت فرمانرايانه اي اجرا مي كند.‏سيستم هاي تشخيص صوت اوليه،‏ براي كلماتقوانين و معيارهايي مشخص مي كردند كه اگر كاربراين قوانين را رعايت مي كرد،‏ برنامه به درستي كارمي كرد.‏ اما زبان انسان ها همواره در حال تغيير بودهو لهجه ها و گويش ها نيزمتفاوت است.‏ حتي اگرلهجه ها و گويش هاي آنهااز نظر برنامه استاندارد باشد،‏سرعت و پيوستگي كلماتممكن است با قوانين برنامهسازگار نباشد.‏ به اين خاطربرنامه هايي كه بر اساساين قوانين نوشته شده اندكاربرد خود را از دست دادندو به اين خاطر برنامه هايقديمي نمي توانستند كلماتمتوالي را تشخيص دهند.‏سيستم هاي تشخيصصوت جديد از مدل سازيآماري قدرتمند و پيچيدهاستفاده مي كنند.‏ اينسيستم ها با استفاده ازمحاسبات رياضي و آماري محتمل ترين نتيجه را به دستمي آورند.‏ به گفته جان گروفولو،‏ مدير گروه سخنراني درآزمايشگاه فناوري اطلاعات موسسه ملي استانداردها وتكنولوژي،‏ 2 مدل پر كاربر كه در نرم افزار هاي امروزياستفاده مي شوند،‏ مدل Hidden Markov و مدلشبكه هاي عصبي است.‏اين روش ها از توابع پيچيده رياضي استفادهمي كنند،‏ اما به صورت خلاصه آنها از اطلاعات معلومبراي سيستم استفاده مي كنند تا اطلاعات مجهول رابه دست آورند.‏Hidden Markov پركاربردترين مدل است.‏در اين مدل هر واج مانند يك واحد زنجير استو از به هم پيوستن آنها يك كلمه به وجود مي آيد.‏اما اين زنجير هنگام به هم پيوستن ممكن است درنقاط مختلف دچار مشكل شود و برنامه نتواند واج ها رابدرستي با صداي توليد شده تطبيق دهد.‏ در اين مرحلهاست كه بايد احتمال واجي را كه بزرگ تر است،‏ پيداكنيم تا براي كامل كردن زنجيرمان استفاده شود.‏ دراين فرآيند برنامه به هر واج محتمل،‏ مقداري اختصاصمي دهد كه به داده هاي آماري بستگي دارد.‏اين فرآيند براي عبارات و <strong>جم</strong>لات پيچيده تر مي شود.‏سيستم بايد تشخيص دهد كه شروع و پايان هر كلمهكجاست.‏ لغت نامه برنامه ها معمولا از 60 هزار كلمهتشكيل شده است و اين كلمه ها 216 تريليون <strong>جم</strong>لهاحتمالي مي توانند تشكيل دهند.‏ طبيعي است كه حتيقدرتمندترين رايانه ها نيز نمي توانند اين تعداد <strong>جم</strong>له راپردازش كنند.‏براي دهه ها،‏ دانشمندان روش هاي آزمايشي توليدكردند تا بتوانند نرم افزارهاي بهتري توليد كنند ؛ امامحدوديت هاي سخت افزاري جلوي پيشرفت آنها رامي گرفت.‏ امروزه با پيشرفت در صنعت رايانه،‏ كار برايآنها آسان تر است.‏ در آينده ممكن است تشخيص صوتبه فهم صوت تبديل شود.‏ اطلاعات آماري كه امروزهبراي تشخيص كلمات به كار مي روند ممكن است درآينده،‏ معناي پنهاني يك كلمه را تشخيص دهد.‏ بااين كه اين اهداف به آرزوهايي دست نيافتني شباهتدارد،‏ اما با پيشرفت هاي به دست آمده در زمينه هوشمصنوعي،‏ ممكن است در 25 سال آينده روزي را ببينيمكه رايانه ها با انسان براحتي گفت وگو كنند.‏منبع:‏ howstuffworks.vomدر صورتي كه از مطالب اين صفحه رضايت داريد ‏«شماره صفحه»‏ را به 30001996 ارسال كنيد.‏11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!